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APRESENTAÇÃO 


Aengenharia elétrica e de computação é fundamental no desenvolvimento 
das tecnologias que impulsionam o mundo moderno. Por exemplo, desde a 
geração, transmissão, distribuição, utilização de energia elétrica, incluindo fontes 
renováveis e redes inteligentes, sistemas de comunicação de dados, redes 
sem fio e telefonia móvel; projeto, desenvolvimento e fabricação de circuitos 
eletrônicos; dispositivos semicondutores e sistemas embarcados. E também, o 
uso da inteligência artificial (IA) para o desenvolvimento de sistemas inteligentes 
e autônomos; IA na saúde, IA no agronegócio, IA na mobilidade, IA na indústria; 
loT para conexão de dispositivos e coleta de dados em larga escala, dentre 
outros. 

De forma geral, no livro, são demonstradas diversas abordagens teórico- 
práticos nos resultados obtidos pelos vários autores e coautores na produção 
de cada capítulo. Além disso, a Atena Editora oferece a divulgação técnico- 
científica com qualidade e excelência, primordial para garantir o destaque entre 
as melhores editoras do Brasil. 


Fabrício Moraes de Almeida 
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A BRUTE-FORCE SYSTEM FOR HID (HUMAN INTERFACE 
DEVICE) ATTACK FOR ANDROID LOCK SCREEN 
DEVICES WITH AUTOMATIC UNLOCK DETECTION 


Mateus Nunes 

Diretoria de Criminalística — Polícia 
Científica de Santa Catarina (PCI-SC) 
Florianópolis — SC — Brazil 


Rafael Schneider 

Diretoria de Criminalística — Polícia 
Científica de Santa Catarina (PCI-SC) 
Florianópolis — SC — Brazil 


ABSTRACT: Electronic devices can be 
used to conduct illegal activities making 
examination of their contents essential for 
criminal investigation. Many mecha- nisms 
implemented over the years for securing 
users" privacy can hinder lawful access 
to phone data. This research investigates 
attack via USB-OTG (On-the- Go) using HID 
(human interface device) and introduces 
a system for both PIN and pattern screen 
lock brute-force. Contributions include 
stop/resume attack and automatic unlock 
detection via sensor on display. An 
assessment was done with 18 compatible 
devices from real cases and found that 66% 
were compatible with password retrieval, 
most of them in less than one week. 
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INTRODUCTION 


With the increasing role of electronic 
devices in everyone's daily life and therefore 
grow- ing demand for privacy and security, 
lawful access to electronic devices has 
become a challenge. Accordingly to [Reedy 
2020], we should expect on the next years 
an increase in number of cybercrimes 
involving loT (Internet of Things) devices, 
online banking, virtual currencies, fraud, 
among other areas, and it is reported that 
the digital forensics worldwide market will 
grow from $4.62B in 2017 to $9.68B by 
2022. 

Digital 'evidences | forensically 
acquired can be of great concern in 
many criminal cases given its potential in 
establishing impartial factual data that can 
acquit an innocent or condemn a guilty 
criminal. These evidences encompass 
crucial artifacts extracted from device's 
memory include: list of contacts, call 
history, text messages received and sent, 
pictures and videos, and GPS location data 
[Chernyshev et al. 2017]. These can be 
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used as evidence in investigations related to serious crimes like drug trafficking, kidnapping, 
murder, and often are the only source of hope solving a case. However, accessing the con- 
tent of mobile phone's storage can be hindered by various factors, including encryption, 
undisclosed or unknown passwords and physical damage, for example. 

Physical access to device's memory has been more difficult since the introduction 
of Full-Disk Encryption (FDE), specifically after many security improvements released 
in Android 4.4. This scheme encrypts the whole content of the storage memory, making 
methods such as chip-off and JTAG almost always ineffective [Loftus et al. 2017]. 

Android 10 and greater homogenized the Platform Security turning mandatory a 
different and rather more secure encryption scheme called File Based Encryption (FBE) 
which assigns an encryption key for each file on the system instead of the whole par- tition, 
making even harder to brute-force the single key used in the previous design 

[Mayrhofer et al. 2021]. Forensic countermeasures include custom bootloaders (for 
full file system dump or password bypass, if applicable), exploitation of bugs, side-channels, 
studies about how a user creates a password [Markert et al. 2021] and social engineering to 
compile better dictionaries, among other techniques for password discovery. Once a device 
is unlocked, keys can be extracted from memory and artifacts can be parsed using methods 
similar to the one described by [GroB et al. 2021]. 

Unlike Apple mobile phones, which are only compatible with a limited set of known 
iOS versions and an even smaller set of hardware manufactured by Apple it- self [Afonin 
and Katalov 2016], Android devices undoubtedly feature a more complex ecosystem of 
operating system versions and security patches updates, including a handful of makers 
of chipsets (e.g. Unisoc, Qualcomm, MediaTek and many others) each own- ing a set of 
semiconductor models, which make possible for some security flaws to be exploitable on a 
given combination of model and software configuration. 

One specific component of Android Security Platform of interest is GateKeeper, 
responsible for implementing user's authentication in a Trusted Execution Environment 
(TEE) and logic for consecutive wrong password attempts, imposing a timeout as penalty 
and even increasing for successive errors, throttling brute-force attempts [Google 2018]. A 
summary of the expected timeout after n-th wrong attempt is shown in Table 1. 


Number of consecutive Calculated timeout 
wrong passwords (x) penalty (seconds) 
[0, 4] 0 

5 30 
[6, 10] 0 
[11,29] 30 
[30, 139] 30 * (2130/10) 
[140, inf) 1 day 


Table 1. GateKeeper timeout penalty algorithm. Source: [Google 2018]. 
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However this penalty system has been acknowledged to have different imple- 
mentations among manufacturers [Potocky' and S'tulrajter 2022, Google 2018], differing 
in timeout increasing steps to even admit fixed timeouts, still providing a theoretical vul- 
nerability for the development of automatic brute-force methods. 

In light of the complex landscape described above, this article introduces a sys- tem 
for screen lock brute-force of Android Phones. The subsequent sections of this paper are 
organized as follows: Section 2 reviews relevant and related works focusing on at- tacks 
targeting password security in mobile devices. Building upon this foundational understanding, 
Section 3 introduces the proposed system for performing a comprehen- sive brute-force 
process, leveraging the capabilities of USB-OTG (On-the-Go) and HID (Human Interface 
Device). The obtained results from the system are presented in Section 4, offering insights 
into the efficacy and performance of the approach across various vul- nerable devices. 
Moving on to Section 5, a thorough discussion is provided, analyzing the implications of 
the results within the context of digital forensics and device security. Finally, Section 6 
concludes the article by summarizing key findings, discussing broader implications, and 
suggesting potential avenues for future research. 


RELATED WORKS 


Android system initially offered three lock options: no lock, PIN or alphanumerical 
(text) password. The PIN consists of a numerical password, while alphanumerical option in- 
cludes characters in upper and lower case, as well as symbols, with a length ranging from 4 
digits/characters to 16. This provides a large key space for brute-force attempts. 

After the introduction of the Android Lock Pattern (ALP) as a screen lock alterna- 
tive in 2008, which involves a 3x3 grid of contact points connected according to a set of 
restrictions (e.g., the number of points must be between four and nine), significant effort was 
devoted to probing its security. The ALP offers a trade-off between security and ease of use 
due to its more limited range of different passwords available for selection. 

Side-channels methods for password discovery, such as analysing smudges and 
oily traces left on screen [Aviv et al. 2010, Cha et al. 2017] , and using captured footage 
from video cameras for finger path guessing, as reported in [Ye et al. 2017, Ye et al. 2018], 
cab be combined with social engineering, psychological factors and us- ability heuristics 
for password creation. These approaches can create a shortlist of possi- ble candidates for 
pattern passwords [Andriotis et al. 2016] or PINs [Markert et al. 2021]. 

Despite showing promising results in theory, side-channels attacks and social en- 
gineering are not always very effective in real scenarios, specially with prevalence of more 
complex patterns or adoption of PIN passwords. This motivates further investigation into 
alternatives, such as exploitation of HID (human interface device). 
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ALPFinder 


The work by [Gómez 2018] proposed ALPFinder (i.e. Android Lock Pattern Finder) 
for brute-forcing pattern lock screens. The setup consisted of an Arduino Leonardo board 
connected to the device with an USB-OTG cable (see Figure 1). The solution involved 
specific code that emulated mouse HID, simulating the swipe unlock pattern. 

Proof-of-concept experiments were conducted on both real devices and software 
emulators, yielding satisfactory results. Although the system was straightforward and did 
not support PIN locks, it provided a significant breakthrough as an attack vector for pattern 
screen locks. 

The main targets for this system were devices with fixed penalty timeout for con- 
secutive incorrect passwords. The approach utilized a probabilistic dictionary of patterns 
with predefined lengths, which had to be uploaded and integrated into the code running on 
the Arduino Leonardo. 

An important reported aspect was the maximum expected time for unlock based on 
the pattern's length. Even when using a dictionary attack approach, the brute force process 
could take weeks, and detecting a successful unlock was not feasible. 

Similarly, because both the program and the pattern list were stored in Leonardo's 
ROM, there was no permanent logging. The entire code had to be recompiled to attempt 
alternative dictionaries or to accommodate delays in drawing patterns of varying lengths. 


Android-PIN-Bruteforce 

Another approach suggested by [Potocky' and S'tulrajter 2022] involved implementing 
a tethered system (shown in Figure 1) which leveraged the HID capabilities of an Android 
device to brute force the PIN of the target device. The tool, Android-PIN-Bruteforce, presents 
a Command-line interface on the host device, allowing configurations such as PIN length, 
timeout duration, and password dictionaries to be set before initiating the process. 

An experiment was conducted using ten devices selected from different brands, 
models and Android versions. The test concentrated solely on the devices” ability to unlock 
the screen once the correct password was sent and on the repeatability of the brute-force 
process when an incorrect password was supplied. The study did not measure the total time 
required for password discovery. 

Overall, compatibility was robust among devices with both micro-USB and USB 
type-C connections. Only one device was reported as incompatible, likely due to the Android 
versions bellow 5.0 lacking adequate USB-OTG support. 

A crucial observation is the absence of pattern unlocking support; the system relies 
solely on PINs. Furthermore, the system depends on the battery life of both the target 
device and the host device. If the battery is depleted, the system shuts down without an 
option to resume the attack, necessitating a restart. 
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Figure 1. On the left: Ul of the Controller module with main actions available for user. On the right: 
output of the brute force process on a real case device, high- lighted PIN password discovered and 
unlock detection. Source: [Gó mez 2018] and [Potocky and Stulrajter 2022]. 


SYSTEM DESIGN 


During a preliminary investigation, we noticed that often when the correct password is 
input on a device, its screen lights up with brighter than in a hold state. On the contrary, when 
the wrong password is entered, the display fades to black a few seconds after the invalid 
password text warning. This behaviour can be exploited for an unlock detection system. 

We propose a novel system composed of two modules: a Controller application 
that communicates wireless with a Worker microcontroller module. The Worker module 
emulates mouse and/or keyboard HID accordingly to the screen lock type (pattern or PIN, 
respectively) and is physically connected to device being exploited by an USB-OTG cable. 

The Worker module also features a light sensor for capturing the actual display 
brightness. It is capable of transmitting this data back to the Controller, enabling automatic 
detection of successful unlock attempt and triggering the brute-force process to stop. 

This system allows low level device access and password input (either PIN, pat-tern, 
or even alphanumeric) to be physically isolated from a higher-level control module. This 
isolation enables functionalities like stop/resume, calibration, and unlocking, which can be 


challenging to implement on a microcontroller. 


Controller module 


The Controller module provides a generic and abstract application for brute-forcing 
pass- words, implementing the main logic, and presenting a user interface for selecting pass- 
word dictionaries, specifying the type of screen lock, calibrating device settings, storing the 
off-screen brightness value threshold (for auto unlock detection), maintaining an over- all 
communication log with timestamps, and initiating start/resume of brute-force attacks. 

Firstly a Bluetooth serial connection is established with the Worker module. Then, the 
user then chooses a dictionary text file and selects the type of password lock on the device, 
calibrates the photosensor value threshold, and enables the brute-force process to start. 
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Once the password is sent to the device, the Controller module waits for a pre- defined 
delay, around a few hundred milliseconds, before probing the current screen brightness. 
Typically, the screen lights up briefly after a successful unlock. If the al- goritnm detects an 
unlocked screen, the process halts, and the UI informs the user that the password has been 
discovered. If not, a timeout period is awaited as a penalty for wrong password attempts. 

Its important to note that the type of lock screen must be configured because drawing 
a pattern on the screen takes significantly more time compared to a PIN password. Thus, 
the algorithm must account for this variation in waiting duration. 

Acalibrated value for screen brightness must be acquired before initiating the process 
to prevent false unlocks triggered by ambient light. See Algorithm 1 for the pseudocode of 
the Controller module. 


Worker module 


The Worker module is based on a microcontroller board with builtin USB HID 
capabil- ities, physically connected to the phone with an USB-OTG cable (either USB type-C 
or microUSB) and receives commands from the Controller via wireless communication. A 
photosensor is connected to one of the microcontroller inputs to measure display bright- ness. 

Itimplements a straightforward protocol to respond actions sent from the Con- troller. 
It emulates a mouse for drawing the pattern or simulates a keyboard to input the PIN to the 
device. As the password is received as text, the Worker module must parse it and proceed 
accordingly based on the lock type. For example, upon receiving “1234”, it must simulate 
moving the cursor while keeping the left mouse button pressed, traversing from position '1º 
to '2','2'to '3', and "3' to '4', ifitis a pattern password. Alternatively, if a PIN is configured, it 
should input '1234” in the same manner as a normal keyboard HID. 
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Require: lock — PIN or Pattern 
Require: photoThreshold 
Ensure: connectedWithWorkerModule 
passwordFound <— False 
while (passwordFound = False) and (listPasswords >= 0) do 
roundPassword < listPasswords.Next() 
SEND roundPassword to Worker module 
if lock is PIN then 
inputDelay — 200 
else if lock is Pattern then 
inputDelay — 400 + (roundPassword.Length() x 2000) 
end if 
WAIT inputDelay milliseconds 
READ photoSensor value from Worker module 
if photoSensor > photoThreshold 
then passwordFound < True 
PRINT passwordFound 
else 
WAIT wrong password timeout penalty for next attempt 
end if 


end while 


Algorithm 1 Controller module algorithm pseudocode 


This module also is responsible for capturing light data from the photosensor, which 
should be attached to the display. It sends this data back to the Controller to be used as 
input for the unlock detection algorithm. 

Considering that devices have varying screen sizes, especially in case of a pattern 
lock, and different phone “wake” keystroke combinations, it's essential to perform a brief 
process of calibration. This process records the mouse pointer's x,y ofísets distances, 
both absolute and relative to other dots, accordingly to the 3x3 dots matrix (for detailed 
implementation, see [Gómez 2018]), as well as validate the correct sequence of keys to 
“wake” a phone. Once the calibration process for a specific model is completed, the values 
can be saved and reused. In some cases, these values can be shared among different 
models or even among among users of the system. 
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Proof of concept 


The proposed system was developed as a proof-of-concept implementation and 
utilized for experimentation. The prototype utilizes an Arduino Pro Micro board featuring 
an ATmega32uU4 microcontroller. This board is equipped with micro-USB input/output, a 
Bluetooth serial module (HC-05) for communication with the Controller, and a GL5528 
model photoresistor for light sensing. To facilitate connection, a pair of USB-OTG cables 
was employed: one designed for USB type-C connectors and another for the micro-USB 
standard. 

The Worker module assembly can be observed on the right side of Figure 2. Notably, 
an elastic band is used to attach the photoresistor to capture display brightness, 


[DO] Lronirdo 
Arguino o 


Figure 2. On the left: Schematic of the system design, presenting an Arduino Leonardo, Bluetooth 
module and light sensor (photo sensor). On the right: Worker module of proof-of-concept, featuring 
Arduino Pro Micro, Bluetooth mod- ule and photo sensor installed on the screen with an elastic band. 


While the device is connected via USB type-C to the Arduino Pro Micro running the 
Worker module code. 

Further configuration screens are depicted in Figure 3. These screens encompass 
setup parameters for establishing a wireless connection with the Worker, reading the 
pho- toresistor value for calibration, and selecting either a PIN or pattern lock type. These 
configurations are essential prerequisites before initiating the brute-force process. 
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Select Serial Port Select Parameters 


com Ne BaudRate: 9600 NA 
Description: Serial Padrão por link Bluetooth Data bits; 8 ” C 7 
“a Force OTG 

Manufacturer: Microsoft Parity: None m - 

Screen off value: cols Lockconfig Help 
Serial number: N/A Stop bits: il ” o - o ai 
Location: 4. |jCOM4 Flow control: None dé ”” Swipe pattern 

+ OK Cancel 
Vendor Identifier: N/A Timeout on error (s): 
Product Identifier: Njá Screen off value: 
Apply 


Figure 3. On the left: serial Bluetooth connection setup parameters UI. Center: photo sensor calibration 
UI. On the right: lock screen type selection menu. 


The user interface of the Controller module is presented in Figure 4. The left side 
of the image provides an overview of available activities. The right side demonstrated the 
interface after a successful attempt highlighting when the brute-force process stopped and 
displaying the discovered password. 


EXPERIMENTAL PROCEDURE 


An experiment was designed to evaluate the efficacy and effectiveness of the brute- 
force OTG HID method and the prototype system. It involved testing these method with 
compatible devices, including with a fixed timeout penalty and increasing penalty interval 


E Brute Force OTG = x [1] 


Serial Tools Lockconfig Help 
5 4 


1 [o 3erê 6 : 
Gu DÍSSDO cusrCiosDO 
- Config Bluetooth COM port 
- Connect to the device 
- Check connection sending “wake up" to phone 
- Load .txt wordlist 
- If pattern password, confirm callibration 


- Get photosensor data. Set off-display value (used for 


unlock detection algorithm) 


6 - Start brute-force 


Connected to COMA : 9600, 8, None, 1, None 


Figure 4. Onthe left: Ul of the controller module with main actions available for user. On the right: 
output of the brute-force process on a real case device, highlighted PIN password discovered and 
unlock detection. 
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Algorithm for either pattern or PIN locks. The maximum attempt time per device was 
limited to two weeks due to feasibility. Efficacy assessment was conducted by recording the 
overall system performance, compatibility and identifying pitfalls. 

Due to time constraints, dictionaries containing the most common PIN and pat- terns 
of a given length, as well customized lists compiled from social engineering, were used in 
the attacks. The total time taken for successful password discovery was recorded as well as 
the wordlists used and password attempt rates of the implemented system. 

lfthe password could not be found with the assigned maximum time, it was marked 
“Negative”, and a commercial forensic tool! was used to attempt to discover it. 

If the password was successfully retrieved using the commercial forensic tool, it 
was added to a wordlist to validate if the brute-force OTG HID implementation could have 
potentially retrieved it, given sufficient time. Even if the system could unlock the device using 
the newly improved list, the result for that specific device remained labeled as “Negative”. 

The commercial forensic tool had limited availability due to high demand from other 
cases. We acknowledge its significantly greater efficiency, which, in most cases, enables 
the breaking of passwords in a fraction of the time required for the completion of brute-force 
OTG HID method. This efficiency has been recognized across-the-board by various law 
enforcement agencies and serves as a benchmark for evaluating the effective- ness of this 
work. 


RESULTS & DISCUSSION 


A total of 18 devices were randomly selected from models known to be compatible 
with brute-force OTG HID method. These devices had a working display and USB connec- 
tor, and were selected from cases with forensic interest, where the password was either 
unknown or not provided. 

These mobile devices came from three manufacturers: Motorola, Samsung and 
Xiaomi, featuring six chipsets (different names for commercial models may share the 
same chipset”). The devices were launched between 2013 and 2021, and they ran Android 
versions ranging from 5 up to 10. 

The devices were also categorized into three groups based on the timeout penalty 
algorithm. Group Aincluded devices with a 30-second penalty after the 5" incorrect password 
attempt. Group B had a 30-second penalty after every incorrect attempt. Group C devices 
had an incremental penalty. 

As detailed in Table 2, results indicated that 66% of the devices were compatible 
with the brute-force OTG HID technique with a positive password discovery. There was 
considerable variability in the duration of password brute-force, ranging from one hour to up 
to eight days, with an average of more than one day for successful unlocks. 


1. Cellebrite UFED/Premium ES — https://Awww.cellebrite.com 
2. Specific models or commercial names withheld for ethical and security reasons. 
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Manufacturer Chipset E k o E a Time e 
Motorola MT6762G B PIN Positive 3 days 
Motorola MT6762 PIN Positive 16 hours 
Samsung MT6765 Cc PIN Negative Positive 
Samsung MSM8916 A PIN Positive 8 days 
Motorola MT6762G B PIN Positive 3 days 
Motorola MT6762G B Text Negative Negative 
Motorola MT6762G B Pattern Positive 1 day 
Samsung SC9863A (6; PIN Positive 1 hour 
Motorola MT6762G B PIN Positive 6 hours 
Motorola MT6762G B PIN Positive 1 hour 
Motorola MT6762 B PIN Negative Positive 
Samsung MT6739 Cc Pattern Negative Negative 
Motorola MT6762 B Pattern Negative Positive 
Motorola MT6762 B PIN Positive 1 hour 
Motorola MT6762 B PIN Positive 5 day 
Motorola MT6762G B PIN Positive 4 day 
Motorola MSM8226 A Pattern Positive 1 day 
Xiaomi SDM439 (6, Pattern Negative Positive 


Table 2. List of examined devices. 


Only one device examined was locked with alphanumerical (text) password that 


could not be retrieved by either tool. Pattern passwords were discovered in only 2 out of 5 


devices (40%). However, the proposed system successfully discovered the passwords of 


most devices locked with PINs (10 out of 12), were compatible with the brute-force process 


(see Figure 5). 


Negative 


E Negative mM Positive 


PIN 


Pattern 


Text 


Figure 5. Left: Brute-force OTG HID results showed that 66.7% of the devices had a positive outcome, 
while 33.3% had a negative. Right: Among devices locked with a PIN, 89% could be cracked, and 40% 
of those with a pattern. No alphanumerical (text) passwords could be cracked within the designated 
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All devices in group A, which used a less secure timeout algorithm, and nine out of 
twelve (75%) devices classified in group B, could be brute-forced. The PIN password was 
only discovered on one of the four devices that had incremental timeout penalties (group 
C), as shown in Figure 6. 


E Negative E Positive 
100% 


75% 
50% 


25% 


0% 


A B c 


Figure 6. Brute-force results by timeout penalty algorithm group. Group A (less secure penalty) 
had password retrieved from all the devices. Group B (medium security): 75% of the devices were 
compatible with password discovery. Group C (incremental penalty): one out of four (25%) were 
positive. 


All passwords retrieved by the forensic tool could be confirmed to work with brute- 
force OTG HID system, and were subsequently added to a wordlist of known pat- terns and 
PINs. Even complex swipe patterns consisting of lengths eight and nine could be correctly 
emulated by HID and accounted for using the proposed delay computation algorithm. Out of 
the devices with negative results with the OTG HID brute-force method, only two could not 
be discovered by the forensic tool. 

Lastly, the recorded attempts per hour (APH) for both PIN and pattern screen locks, 
for Group A and Group B timeout algorithms are presented in Table 3. The data shows 
no variation in rates for PIN passwords despite their length, providing a more precise 
anticipation of the maximum brute-force duration. In contrast, rates for pattern locks are 
notably lower and change in accordance with their length. Longer patterns take significantly 
more time to exhaust the dictionary compared to smaller ones. For instance, pattern length 
6, despite being only 2.6 times the key space of PIN length 4, can take up to approximately 
10 times longer to exhaust the dictionary. 


Attempts PIN PIN Pattern Pattern 


Pimeaur penaliyalgoraa per hour(PIN) | (length 4) | (length 6) | (length 4) | (length 6) 


Group A 15hours | 12 days 
(30s penalty afterthe 5" incorrect) neu 26 hOUMS | AMONIAS | (A pH410)| (APH9D) 
Group B 100 5 days 14 24 hours | 18 days 


(30s penalty aftereach attempt) months | (APH70) | (APH 62) 


Table 3. Group A and Group B devices fixed timeout penalty algorithms and maximum expected time to 
exhaust the dictionary. 
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DISCUSSION 


In total, twelve out of eighteen devices (66%) could be brute-forced within a 
reasonable short period of two weeks. However, it must be noted that only a fraction of the 
total possible patterns, for example, was tested, underscoring the crucial need for a concise, 
probabilistic, and reliable dictionary. 

Regarding PIN locks, their length is variable between 4 to 16 digits, theoretically 
offering greater security due to the significantly larger key space. Nonetheless, the re- 
sults revealed that most PINs are actually much shorter, and effective dictionaries can be 
generated using social engineering information or probabilistic data from prior suc- cessful 
attempts. Paradoxically, despite the smaller key space, pattern passwords proved to be 
more difficult to retrieve than PINs, suggesting that alternatives to HID should be explored. 

Despite the limited sample size of only a single device configured with an alphanu- 
meric (text) password, brute-forcing it was significantly more challenging. This was due to 
the fact that the password could comprise letters, numbers, and special characters, adding 
to the immense complexity of the key space. The vastness of the key space made the use 
of the proposed system nearly impractical, even when considering only a fraction of the 
available key combinations. In fact, if we take into account the scenario of increas- ing 
penalty throttling, alphanumeric passwords could impose significant difficulties even for the 
commercial forensic tools, considering the time constraints. 

While one device was not compatible with the commercial forensic tool during the 
experiments, it remained compatible with HID emulation and thus with the brute- force OTG 
HID method. This suggest a potential application of this system as a final alternative for 
devices that are incompatible with forensic tools. 

During longer sessions, it was observed that the device's battery sometimes ran 
out. However, in all cases, the brute-force process could be resumed using the log of the 
Controller module. An alternative for extended sessions is to use a special power connector 
directly attached to the main logic board of the device or to employ an external power 
source, replacing device's battery with a continuous source. 

False detection of unlocks was relatively common in devices with clock alarms 
configured. Given this, a false-positive detection is much preferable to missing a true un- 
lock, as the process can always be resumed. However, once a password has been verified, 
it should not be retested to avoid wasting time. Furthermore, false detection was rarely 
observed in pattern-locked devices but more common in PIN-locked devices. 
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CONCLUSION 


In this work we proposed a novel system consisting of two modules for attacking 
lock screen protections on Android devices using HID brute-force via USB-OTG technique. 

Our system identifies a correct password attempt by detecting changes in screen 
brightness, exploiting the increase in light that devices emit after a unlocking. This ap- 
proach is particularly valuable, as the extended wait times required for brute-force at- 
tempts, ranging from days to weeks, render a manual unlock detection method unfeasible. 

We designed an experiment to assess the efficacy and effectiveness of the proposed 
system using a prototype implementation, and we used a commercial forensic tool as an 
alternative benchmark for password discovery. 

The results revealed that the correct password was successfully retrieved from ap- 
proximately 66% of the devices within a span of up to two weeks. This outcome validates 
the system as a viable option, especially for devices with less secure implementations 
of timeout penalty algorithms. Moreover, considering the overall low cost of building the 
apparatus and the minimal risk to the examined evidence, the system presents a promising 
solution for device triage as well. 

A potential future approach to mitigate throttling enforcement by the GateKeeper 
Android component involves exploiting vulnerabilities in the USB-OTG protocol or reset- 
ting the failed password counter after each attempt. This strategy aims to avoid disrupting 
password authentication and could allow for higher attempt rates, facilitating a more com- 
prehensive search across the entire key space. 
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RESUMO: O capítulo do livro apresenta um 
estudo sobre: Rondônia teve um crescimento 
e desenvolvimento de infraestrutura de forma 
tardia, devido ao contexto histórico de sua 
ocupação ser dependente de movimentos 
migratórios exploratórios temporários 
com pouco preocupação de construção 
de estruturas permanentes. Anos mais 
tarde isso resulta em alta dependência em 
termelétricas para geração de forma custosa 
e em polos isolados, mas as características 
propícias da sua bacia hidrográfica alteraram 
o cenário de dependência para grande 
gerador de energia elétrica nacional com 
grande quantidade de usinas de pequeno 
e grande porte. Agora o crescimento de 
sua rede de distribuição por grandes 
investimentos de concessionárias locais 
reverte situação conectando as populações 
antes isoladas e desligando as termelétricas, 
agora desnecessárias. 
PALAVRAS-CHAVE: Redes de Distribuição 
Elétrica. Rondônia. Termelétricas. Energia 
Elétrica nacional. 
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STUDY ON THE DEVELOPMENT OF THE ELECTRIC DISTRIBUTION 
NETWORK IN RONDÔNIA 


ABSTRACT: The book chapter presents a study on: Rondônia had a late growth and 
development of infrastructure, due to the historical context of its occupation depending 
on temporary exploratory migratory movements with little concern for the construction of 
permanent structures. Years later, this resulted in a high dependence on thermoelectric 
plants for costly generation and in isolated poles, but the favorable characteristics of its river 
basin changed the dependence scenario for a large national electricity generator with a large 
number of small and large plants. size. Now the growth of its distribution network due to 
large investments from local concessionaires reverses the situation by connecting previously 
isolated populations and turning off the now unnecessary thermoelectric plants. 
KEYWORDS: Electrical distribution networks. Rondônia. Thermoelectric plants. National 
Electrical Energy. 


INTRODUÇÃO 


O sistema elétrico de potência (SEP) faz parte da infraestrutura de estado nacional, 
formado por 3 setores distintos: geração que utiliza todo a matriz elétrica disponível no 
território federal na produção de energia, transmissão criando as estruturas de longo 
alcance pelo transporte e disposição da energia em altas tensões (230 kV) a polos de 
distribuição e subestações, distribuição utiliza subestações abaixadoras ou elevadores 
para adequar e corrigir o nível de tensão da energia fornecida a consumidores que podem 
representar a população ou comércios e indústrias [1]. 

Para o estado de Rondônia o seu histórico precisa ser contemplado com as 
motivações políticas e econômicas dos movimentos migratórios responsáveis pela 
construção de sua infraestrutura como estado e atuação de agentes governamentais que 
lideram o setor elétrico. Outros fatores característicos devido pela sua posição geográfica 
como: Relevo, fauna e flora, hidrografia e clima se mantém relevantes devido a soma 
desses atributos definem as adversidades enfrentadas por projetos a serem iniciados na 
região, dentre eles o acesso à região, logística de materiais para construção e suprimentos 
como remédios para lidar com enfermidades locais, todos esses fatores foram de extrema 
relevância na construção do estado. 

O Ministério de Minas e Energia chefia a criação de agências governamentais 
que operam no setor elétrico como Agência Nacional de Energia Elétrica (ANEEL) com 
autoridade sobre decisões administrativas e fiscaliza as empresas que atuam no setor como 
concessionarias. Operador Nacional do Sistema Elétrico (ONS) responsável pelo controle 
da rede pertencente ao Sistema Interligado Nacional (SIN) que cobre todo o país, a criação 
das Centrais Elétricas de Rondônia S/A (CERON) de origem governamental e responsável 
pelo setor elétrico de Rondônia, e quaisquer outras empresas que aparecem na história do 
estado com relações diretas ao setor elétrico, tem influência no desenvolvimento da rede 
de forma direta ou indireta. 
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O histórico do setor elétrico dentro e fora do estado pode ser feito em dois períodos 
distintos, a geração e distribuição anterior a existência do Sistema Interligado Nacional (SIN), 
e o processo de conexão com o SIN trabalhando de forma uniforme com o restante do país. 
A dependência a certos tipos de gerações locais passa a ser substituída por uma rede mais 
robusta e desenvolvida que permite a transferência de cargas de forma eficiente controlada 
por empresas de atuação local em distribuição conhecidas como concessionarias. 

A expansão física da rede em conjunto com o desligamento de termelétricas 
permite visualizar a evolução da rede de distribuição, com polos anteriormente isolados 
e dependentes agora com acesso às cargas geradas em outras regiões ou por métodos 
alternativos. As termelétricas agora redundantes se tornam um ponto de referência com o 
antigo valor de geração de carga comparado com o consumo de parcelas da população 
que foram migradas de sistemas isolados para a nova rede proporcionada pelo SIN. 


FUNDAMENTOS TEÓRICOS 


Nesse capítulo será apresentada a pesquisa bibliográfica realizada para servir 
como referencial e motivação desse estudo. Assim, a revisão foi subdividida por meio de 
três principais aspectos: as rochas ornamentais e a indústria brasileira, os resíduos de 
marmorarias, e o estudo das propriedades físicas e mecânicas decorrentes da incorporação 
dos resíduos em argamassas. 


Histórico de Rondônia 


O estado de Rondônia, anteriormente conhecido Território federal do Guaporé, foi 
fundado em 1956 em homenagem ao Marechal Rondon [2]. Ele foi responsável por realizar 
obras de desbravamento e instalação de rede de comunicação nas regiões Norte e Centro- 
oeste do país, como a primeira linha telegráfica. Mas a história e movimentos migratórios 
relevantes do estado antecedem sua constituição formal pelo governo federal na década 
de 50. 
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MAPA POLÍTICO DO 
- *, ESTADO DE RONDÔNIA | 


Figura 1 - Mapa Político do Estado de Rondônia (IBGE,2009) 


As principais migrações históricas de grande porte do estado estão associadas aos 
movimentos exploratórios por recursos naturais, os responsáveis pelo maior deslocamento e 
desenvolvimento de povoações na região são os relacionados ao primeiro ciclo da borracha, 
a construção da Estrada de Ferro Madeira Mamoré e o segundo ciclo da borracha [6]. 

Para o primeiro ciclo da borracha que ocorre durante o século XIX (1877 - 1910), com 
a exploração de seringueiras na região amazônicas para extração matéria prima do látex, 
trazendo muitos trabalhadores da região nordeste do país. Esse movimento acompanhou 
margens dos rios como Amazonas e Madeira para o que seria o atual território de Rondônia. 
O fim desse primeiro ciclo se deve ao crescimento de um mercado rival de extração de látex 
com plantações de seringueiras montadas em território asiático colonizado por europeus. 

O tratado de Petrópolis assinado entre os governos do Brasil e Bolívia em 1908, 
tratava entre vários tópicos, dois mais importantes para migração do estado, a anexação do 
território do estado do Acre e a construção de uma ferrovia afim de melhorar a infraestrutura 
da região e o transporte da borracha amazonense. 

A ferrovia conhecida como Estrada de Ferro Madeira Mamoré (EFMM), teve o início 
da sua construção no ano de 1907 e conclusão no ano de 1917, a construção teve uma 
grande migração de trabalhadores de todas as regiões do país e de fora. A dificuldade de 
trabalhar em regiões remotas em conjunto com as más condições médicas fez que que 
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essa obra sofresse grandes atrasos e um alto índice de mortes proveniente de doenças 
como malária e febre amarela, extremamente comum na região. [7] 

O segundo ciclo da borracha de menor impacto, decorrente da segunda guerra com 
a necessidade de látex pelos aliados, visto que Japão pertencente ao eixo ocupou pacífico 
e sudeste asiático que haviam se tornado o novo polo de extração do látex e negando as 
forças aliadas de material necessário para produção de borracha. 

Desde então o maior movimento migratório, ocorrido entre as décadas 1970 e 1980 
[8], ao estado tem sido um último de maior escala em procura de um pedaço de terra para 
moradia fixa e produção agropecuária a estímulo do governo federal. 

Uma das características geográficas mais importantes do estado é a presença do 
rio Madeira, pertencente a bacia hidrográfica do rio Amazonas [26]. O valor estudado neste 
trabalho é o seu potencial hídrico para atividades de geração elétrica através de duas 
grandes usinas hidroelétricas (UHES), Jirau e Santo Antônio. 


Agências Federais 


A Agência Nacional de Energia Elétrica (ANEEL) é um órgão regulador criado pelo 
Ministério de Minas e Energia pela Lei nº 9.427/1996 e do Decreto nº 2.335/1997 [3]. Tendo 
suas funções principais de natureza administrativa e federal. 

Ela se responsabiliza pela regulação dos três setores do sistema elétrico de 
potência (geração, transmissão e distribuição), isso ocorre através da fiscalização direta 
das concessionárias, estabelecimento de tarifas para cada setor, definindo as diretrizes a 
serem seguidas para aproveitamento de recursos naturais na geração (como no caso de 
rios usados por hidrelétricas), conferindo concessões a empresas e empreendimentos que 
procuram trabalhar no setor elétrico e implementando novas regras definidas pelo governo 
federal. 

O Operador Nacional do Sistema Elétrico (ONS), é um órgão de constante atuação 
no setor elétrico, coordenando ações entre diferentes empresas e concessionarias dos 
setores de geração e transmissão conectadas ao SIN assim como redes de operação 
isoladas presentes no país. Trabalha debaixo da ANEEL e foi criada pela Lei nº 9.648, 
futuramente sofreu alterações com a lei nº 10.848/2004, sua regulamentação segue o 
Decreto nº 5.081/2004. [4] 

Suas principais funções têm objetivo de garantir suprimento contínuo de energia 
elétrica a todo país de forma segura, por isso sua autoridade em coordenação de atividades 
entre diferentes empresas de diferentes setores de forma simultânea dentro do SIN. 
Promover o crescimento e otimização de todo SIN usando padrões definidos pela ANEEL, 
melhorando sua própria rede para garantir estabilidade e acesso irrestrito a população de 
seus benefícios. 


Engenharia elétrica e de computação tecnologia em evolução Capítulo 2 


20 


O Sistema Interligado Nacional, é definido pela junção do setor de geração e 
transmissão de energia elétrica do Brasil, sendo constituído por gerações de grande parte: 
hídrica, térmica e eólica, todas de grande porte, e geração hídrica sendo a maior de todas. 
O sistema se divide em 4 subsistemas baseado nas regiões do brasil: Sul, Sudeste/Centro- 
Oeste, Nordeste e partes da região Norte que ainda apresenta crescimento do SIN. [5] 


Figura 2 - Mapa de Conexões do SIN (ONS, 20283). 


A junção de todas as gerações do país em uma única rede, atribui ela a possibilidade 
de compensar por faltas em qualquer ponto com a geração de outro, atingindo seu objetivo 
de uma rede estável e segura para o mercado. 

A maior parte da geração de carga fornecida ao sistema vem de hidrelétricas, 
aproveitando a grande poder hídrico do brasil, as usinas térmicas que também foram uma 
grande fonte de energia ainda têm presença para compensar quaisquer perdas que possam 
acontecer no sistema e pontos mais isolados com necessidade de carga que era o caso no 
estado. Com o passar dos anos houve um aumento no uso de usinas eólicas nas regiões 


nordeste e sul, para o nordeste isso se deve a sua região litorânea. 
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Aenergia solar tem se tornado outro investimento de geração tanto com investimentos 
privados e governamentais que apresenta um crescimento de 59,4% nesse ano [10], sendo 
a soma da capacidade de usinas e de sistemas de geração próprios. 


Setor Elétrico 


Os três setores do SEP: geração, transmissão e distribuição. Trabalham de forma 
independente e no caso de Rondônia o destaque pode ser dado para os setores de geração 
e distribuição, com as hidrelétricas e termelétricas para geração, a distribuição expandindo 
a rede nos pontos urbanos e conectando polos rurais a rede interligada e a outros pontos de 
geração menores. Por último a transmissão lida com a conexão da geração do estado com 
o restante do país usando principalmente uma linha de 230 kV que cruza todo o estado. 

A geração de energia elétrica vem da transformação de algum tipo de energia para 
a energia elétrica, isso é definido pela matriz elétrica de um país que é o conjunto de fontes 
disponíveis para geração de energia elétrica [11]. Em uma visão global a matriz energética 
é feita principalmente de combustíveis fósseis que são fontes não renováveis enquanto a 
matriz brasileira é feita principalmente de fontes renováveis. 

Petróleo e 


derivados, 
2,5% 


Carvão 


Mineral, 35,0% 
Maremotriz, 


0,004% fé 


Geotérmica, 
0,4% , 
Eólica, 6,0% Hidráulica, 


9 
Solar térmica, 16,6% 


0,1% Solar fotovoltaica, 
3,0% Resíduos, 0,4% Biomassa, 2,5% 


Figura 3 - Matriz energética global (EPE, 2023). 
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Figura 4 - Matriz energética Nacional (EPE, 2023). 
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Figura 5 - Tabela de matrizes do Brasil e mundo (EPE, 20283). 


Geração 

A geração em Rondônia devido a seu histórico foi em grande parte de termelétricas 
devido à dificuldade de acesso à região junto dos movimentos migratórios exploratórios, a 
evolução do estado e a construção de grandes hidrelétricas fez que o esse cenário mudasse 
transformando-o em um grande produtor energético, mas com um setor de distribuição 
ineficiente que acarretam grandes custos operacionais devido à falta de logística para 
transporte [13]. Isso faz que esses dois tipos de geração sejam de destaque para o estado 
com suas possibilidades de geração local distinta que representa a dicotomia da geração 
na região. 
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Geração termelétrica funciona na base de conversão de três tipos diferentes de 
energias, energia térmica para mecânica e de mecânica para elétrica [12]. Pela praticidade 
de motores movidos a combustíveis, fez que esse método de geração fosse usado durante 
os movimentos que ocuparam o estado pois com o difícil acesso à região, ter geração de 
energia local era a única opção por falta de uma rede distribuição, por mais que tivesse alto 
custos pela dependência em combustíveis. 
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VA VAPOR (ALTA PRESSÃO) 
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QUEIMA 
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COMBUSTIVEL 
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VAPOR (BAIXA PRESSÃO) 


CONDENSADO 
R 
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Figura 6 - Máquina térmica (Saidel, 2013). 


A queima do combustível caracteriza o processo de combustão que é uma reação 
exotérmica de liberação da energia presente nas ligações químicas nas moléculas que 
compõem o combustível usado, essa energia se apresenta na forma de calor usada para 
realizar trabalho mecânico usando pistões ou turbinas, podemos dividir esse processo em 
dois grupos: combustão externa e interna. 

Para o caso da combustão externa, o calor liberado pela queima de combustível é 
usado para aquecer algum outro fluido responsável pelo trabalho de movimentar os pistões, 
um caso simples seria aquecer água para gerar vapor que se expande e movimenta os 
pistões. Podem ser vistos como exemplo as antigas máquinas a vapor. 

Na combustão interna, parte do combustível é misturado com ar para aumentar seu 
poder de expansão na combustão gerando mais força de forma explosiva que consegue 
movimentar os pistões ou turbinas. Um exemplo disso pode ser visto em motores de carros 
e outros veículos. 

O movimento criado pela energia mecânica por usa vez é conectado a um gerador 
de energia elétrica, conectando o motor de combustão com o eixo dele, temos então a 
última etapa de transformação de energia onde energia mecânica é transformada em 


energia elétrica. 
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Com a geração hidrelétrica à água se torna a fonte de energia mecânica usando o 
volume e potencial encontrado em quedas d'agua. Ela pode ser dividia em dois principais 
tipos de geradoras: as grandes usinas hidrelétricas (UHE) que produzem grande parte da 
energia brasileira e as pequenas centrais hidrelétricas (PCHs) que são usadas em escala 
menores para atender a população local. 

O princípio físico de seu funcionamento é a soma da força mecânica produzida por 
um desnível de água com a vazão do corpo d'agua onde a usina é instalada, o conjunto 
dessas forças mecânicas aplicadas a bobinas é o responsável pela geração. [22] 

Para conseguir alcançar valores constantes de queda e vazão são construídas 
as barragens como parte da estrutura da usina possibilitando o controle humano para 
a geração fazendo dela artificialmente estável mesmo sendo dependente de estações 
climáticas em relação ao nível hidráulico da fonte. 

As estruturas fundamentais de uma usina podem ser consideradas como sendo a 
barragem, tomada d'agua, vertedouro, casa de força e subestação. 

Um dos maiores diferenciais desses métodos é a eficiência da geração entre as 
termelétricas e hidrelétricas. No caso de termelétricas o combustível utilizado assim como 
o método determinam a sua eficiência da conversão de energia, de forma branda pode se 
dizer que carvão possui uma eficiência entre 20% e 38% enquanto combustíveis fosseis 
possuem no máximo 45% [27]. 

As hidrelétricas têm como principal fator as suas turbinas para determinar sua 
eficiência considerando uma vazão de água constante. Usando modelos mais comuns de 
turbinas hidráulicas (Pelton, Kaplan e Sifão), é possível ter um rendimento de acima de 
80% de conversão de energia [28] fazendo deste o método mais eficiente e ótimo para 
larga escala. 


Geração em Rondônia 


A geração em Rondônia devido a seu histórico foi em grande parte de termelétricas 
devido à dificuldade de acesso à região junto dos movimentos migratórios exploratórios, a 
evolução do estado e a construção de grandes hidrelétricas fez que o esse cenário mudasse 
transformando-o em um grande produtor energético, mas com um setor de distribuição 
ineficiente que acarretam grandes custos operacionais devido à falta de logística para 
transporte [13]. Isso faz que esses dois tipos de geração sejam de destaque para o estado 
com suas possibilidades de geração local distinta representando a dicotomia da geração 
na região. 

A construção da primeira PCH do estado em Vilhena, conhecida como PCH Rio 
Vermelho inaugurada em 1987 e com potência instalada de 2600 kW [23]. Demonstrou o 
grande potencial presente e uma alternativa viável para o desenvolvimento do estado, pois 
a dependência em termelétricas em cidades do interior fez que durante a década de 90 
existisse racionamento de energia com fornecimento variando entre 6 e 12 horas por dia, 
mas com introdução de PCHs era possível alcançar fornecimento 24h/dia. 
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No ano de 2022 apresentava-se um total de 44 diferentes PCHs distribuídas pelo 
estado como pode ser observado no Anexo D com um mapa de todas as subestações 
ativas e PCHs representadas por um triângulo preto, elas se encontram espalhadas em 
grande parte no sul do estado como é o caso da Rio Vermelho mencionada anteriormente 
nas proximidades de Vilhena e outra grande parcela na fronteira norte com o estado do 
Amazonas e o Rio Madeira. 

Anos mais tarde isso resultou na construção das Usinas de Jirau e Santo Antônio 
no Rio Madeira. 


Amazonas 


Amazonas 


o 25 50 100 


Fonte dos Dados: Instituto Brasileiro de Geografia e Estatística 


Figura 7 - Mapa das grandes usinas em Rondônia (Rainey, 2016) [20]. 


Transmissão 


Os serviços de transmissão de energia compreendem de múltiplos sistemas 
de controle e infraestrutura construída para fins de transferência de cargas por longas 
extensões do território nacional, utilizando estruturas especializadas para o alto nível de 
tensão e métodos especiais para garantir a segurança e manutenção da rede. 

Atransmissão é composta de dois tipos de redes a Rede Básica (RB) e Rede Básica 
de Fronteira (RBF), ambas fazem parte do SIN. A divisão ocorre baseada no nível de tensão 
encontrada pela rede, com a RB sendo para linhas e estruturas que atendem tensões 
iguais ou superiores a 230 kV, a RBF possui linhas e estruturas de para tensões iguais ou 
superiores 230 kV assim como redes de tensão inferiores a mesma. [14] 
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No estado de Rondônia o destaque aparece na linha de transmissão conectando 
ambas UHE de Jirau e Santo Antônio a subestação Coletora utilizando linhas de transmissão 
de curta distância, mas 500 kV de tensão e então rebaixado a 230 kV para conexão com o 
restante da linha de transmissão Norte-Sudeste. [15]. 
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Figura 8 - Mapa do SIN em Rondônia (ONS, 2023). 


O trabalho da distribuição de forma sucinta é, levar energia elétrica recebida 
em suas subestações conectadas a linhas de transmissão até o consumidor, com sua 
performance sendo fiscalizada pela ANEEL que observa a qualidade do serviço através de 
vários indicadores como: 


* Nível tensão e qualidade de energia, observa as variações no nível de tensão 
causada por perturbações. 


* | Atendimento telefônico, tanto o tempo de resposta a reclamações como a quan- 
tidade das reclamações recebidas e casos finalizados 


* | Cumprimento de metas de programas elaborados pela ANEEL, se as empresas 
contribuíram para o desenvolvimento de programas sociais relacionados ao se- 
tor como Luz para Todos. 
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* | Comercial, sobre a eficiência de respostas de suas atividades como realização 
de leituras, conexão de novos clientes a rede, suspensão, faturamento e res- 
sarcimentos. [18] 

A divisão da distribuição e sua categorização quanto ao nível de tensão ocorrem 
nas subestações responsáveis pelo acolhimento das correntes providenciadas pelas linhas 
de alta tensão da rede de transmissão ja discutidas. As categorias de tensão são agora de 
alta tensão para valores dentre 69 kV e 230 kV, média tensão dentre 2,3 kV e 69 kV e baixa 
tensão para valores menores de 2,3 kV [16]. 

As subestações de distribuição fazem a diminuição do nível de tensão para um nível 
uniforme adequado da rede de distribuição, pois os valores obtidos nas linhas transmissão 
são altos demais para os consumidores, necessitando de outros transformadores instalados 
por toda a rede como vistos em postes para novamente abaixar a tensão e adequando para 
uso residencial. 

O controle dessas subestações é realizado por concessionarias que adquirem 
licitações provenientes de leilões elétricos realizados pela ANEEL, com as concessionarias 
fazendo ofertas pelo direito de atuação em regiões apresentadas. As ofertas efetuadas pelas 
concessionárias diferentes dos leilões normais onde o maior preço se torna o ganhador, 
procura-se o menor preço que reflete o custo pela prestação de serviço a ser realizado pela 
empresa participante. Logo o contrato para a prestação de serviço de distribuição elétrica 
cabe a empresa que promete o menor custo, neste caso isso reflete o melhor preço. [17] 

O serviço de distribuição de energia elétrica é realizado por aproximadamente 105 
diferentes agentes, sendo 52 Concessionárias, 52 Permissionárias e 1 Designada usando 
os dados de 2021 [19]. Com um total de unidades consumidoras (UCs) de 89.951.879 
atingindo uma população total de 208.488.847 pessoas. 
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Distribuição em Rondônia 
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C.056.RO.2001 ERO 1.759.640 831.107 60 237.766,62 ECT 002/2018 de 30/10/2018; ECT 00! 


Figura 9 - ANEEL — Mapa das distribuidoras (ANEEL, 2023) [25]. 


Para monitorar de forma eficiente a todos a ANEEL exige uma série de relatórios e 
planos sobre as atividades realizadas assim como futuras, dentro das atividades futuras é 
possível destacar o Plano de Desenvolvimento da Distribuição (PDD). 

O Plano de Desenvolvimento de Distribuição (PDD) se refere ao amontoado de 
estudos realizados pelas empresas responsáveis pela distribuição sobre os investimentos 
planejados para o ano seguinte baseado nas ações realizadas pelas subestações de baixa, 
média e alta tensão. 

Os investimentos planejados dentro do PDD se dividem em 3 setores: 


* | Expansão: cobre todos os investimentos relacionados ao incremento de carga 
disponível, seja pelo crescimento físico da rede que atende um número maior 
de clientes aumentando a demanda ou necessidade de clientes especiais de 
setores industriais. 


* Melhoria: são os investimentos relacionados a estabilidade e qualidade da rede, 
como novos equipamentos de proteção a serem instalados na rede para melhor 
controle e obtenção de dados, reguladores de tensão corrigindo níveis de ten- 
são em longos trechos mantendo a rede uniforme e balanceada evitando danos 
a dispositivos. 
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* | Renovação: custo de manutenção da rede e troca de equipamento que atingiu 
limite eficaz de funcionamento e outros ativos que foram danificados de alguma 
forma. 

Esses investimentos mencionados podem fazer parte de outros programas 
governamentais de infraestrutura. Dentre eles o que possui maior destaque para o tema de 
crescimento de rede é o Programa Luz para Todos. 

O programa Luz para Todos desenvolvido pelo governo federal em 20083, procura 
transformar a energia elétrica e seu fornecimento um serviço público de fácil acesso a 
todos, melhorando a qualidade de vida e tendo uma maior integração da população. 


Descr TipoObra GExpansão OMelhoria O Renovação 


0,58 Bi 


0,39Bi 


0,23 Bi 


0,05 Bi 0,06 Bi 0,05 Bi 
0,01 Bi 0,008Bi na 


2019 2020 2021 2022 


Descr TipoObra 


Expansão 234.411.784,00 390.761.311,27 579.900.389,81 532.303.486,30 1.737.376.971,38 
14.017.309,00 52.530.967,65 56.852.525,04 217.523.037,08  340.923.838,77 
Renovação 2.850.000,00 37.878.870,15  50.731.651,42  61.702.812,31 153.163.333,88 
251.279.093,00 481.171.149,07 687.484.566,27 811.529.335,69 2.231.464.144,03 


Descr TipoObra. 


Luz Para Todos 66.752.526,00 36.556.216,71 51.969.635,82 95.98241347 251.260.792,00 
Obra com Participação Financeira 3.620.164,30 3.620.164,30 
Planejamento Setorial 19.826.326,00 245.891.655,04 265.717.981,04 
86.578.852,00 282.447.871,75 51.969.635,82 99.602.577,77 520.598.937,34 


*As informações aqui apresentadas foram encaminhadas pelas distribuidoras e podem, eventualmente, ser revisadas. 


Figura 10 - ANEEL — PDD Investimentos (ANEEL, 2023) [25]. 


Enquanto esses planos demonstram o futuro planejado pelas concessionárias e 
seus investimentos para a expansão da rede de distribuição para atender a população. Um 
estudo sobre o perfil do consumo de energia e do número de consumidores dividido em 
categorias de uso pode ser visto abaixo com dados de 2007 até 2017. 
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Figura 11 - Consumo em MWfh por tipo de cliente registrador (autoria própria) [2X]. 
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Figura 12 - Quantidade de clientes por categoria de uso (autoria própria). 


Segue uma série de observações sobre o crescimento do consumo de energia em 


MW/h e do número total de clientes dos anos de 2007 a 2017 em cada categoria: 


* | Residencial: Crescimento no consumo de 112% e de 51% no número de clien- 
tes, uma residência pode representar valores associados a uma única pessoa 
ou um grupo familiar maior em centros urbanos, de forma simplista pode se 
dizer que consumo foi o dobro da quantidade de novos clientes inseridos na 
rede, indicando que cada residência consome mais com o passar do tempo. 
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* Industrial: Crescimento de 18% no consumo e o único caso de diminuição no 
número de clientes de 25% (de 2.252 para 1.685). Este caso indica que ou um 
grande número de indústrias saíram de Rondônia e as que permaneceram au- 
mentaram suas atividades e possivelmente expandiram gerando o aumento de 
consumo, ou que uma quantidade maior de indústrias saiu do estado e foram 
substituídas por indústrias novas que apresentam um perfil de consumo maior. 
Dentre atividades industriais do estado é possível destacar mineração de cas- 
siterita e processamento de matéria prima como siderúrgicas e madeireiras. 


* | Comercial: Crescimento de 69% em consumo e 32% de clientes. Apresenta um 
crescimento similar ao residencial de consumo ser o dobro de clientes, mas le- 
vando em consideração que o número de comércios é aproximadamente onze 
vezes menor que o de residências (40.456 contra 458.222), com consumo sen- 
do apenas metade (629.935 contra 1.225.446) residencial. Isso pode ser atri- 
buído ao fato que comércios apresentam máquinas de alto consumo elétrico de 
uso contínuo como frigoríficos em supermercados. 


e Rural: Crescimento de 111% em consumo e 66% de clientes. Acompanha o 
crescimento residencial e comercial descrito anteriormente, como o estado 
apresenta grande atividade agropecuária não é surpreendente que população 
fora de centros urbanos também tenham crescido, como mencionando anterior- 
mente muitos projetos do governo como Luz para Todos tem acessibilidade a 
energia elétrica como um foco que faz desse crescimento algo consistente com 
o resto. 


* Poder Público, Serviço Público e Iluminação Pública: Nas categorias listadas 
temos o governo do estado como cliente e com crescimento planejado para 
fornecer infraestrutura básica tanto a população como órgãos necessários. Em 
termos de números apenas o poder público apresenta um grande número de 
clientes (4.703 clientes em 2017 com um crescimento de 36%) enquanto os ou- 
tros são apenas algumas centenas (280 para iluminação e 267 para serviços). 
Dentre os três a iluminação teve o maior crescimento de consumo de 103% que 
acompanha as ideias discutidas sobre o setor de distribuição de Rondônia ter 
um perfil expansionista, fazendo a iluminação pública acompanhar esse pro- 
gresso. 


* Próprio: São os casos de clientes que possuem geração própria para se abas- 
tecer, mas se encontram conectados à rede de distribuição de forma regular. 
Apresentam números totais pequenos de clientes (142 em 2017) com apenas 
23% de crescimento, mas consumo maior de 62%. 

No total Rondônia teve um crescimento no seu número total de clientes de 52% 
(416.276 em 2007 e 632.946 em 2017) e consumo em 79% (1.627.452 em 2007 e 2.920.273 
em 2017 ambos em MW!h). O consumo de cada município de forma individual é visível no 
anexo A no mesmo formato de MWf/h, os dados sobre a quantidade de consumidores de 
cada município apresentavam erros e foi informado os responsáveis na SEPOG (Secretaria 
do Estado de Planejamento, Orçamento e Gestão). 
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A distribuição para esses municípios começa inicialmente das subestações da 
concessionaria seguida de alimentadores que dividem a rede podendo cobrir bairros 
ou até municípios inteiros dependendo da escala do consumo. Essa expansão física 
de rede requer um grande investimento para construção de subestações, equipamento 
especializado como relés de proteção e transformadores de corrente, outros mais comuns 
como os postes e cabos necessários 

A quantidade de subestações e alimentadores são proporcionais ao consumo 
da região, usando dados de Porto Velho em 2014 podemos encontrar 49 alimentadores 
distribuídos entre 5 subestações (Porto velho, Tiradentes, Rio Madeira, Alfavile e Areal) 
enquanto para um município menor como de Itapuã apenas uma subestação com um único 
alimentador era necessária para abastecer a região. Um mapa modificado das subestações 
existentes em 2022 é visível em anexo assim como a conexão unifilar do sistema de 2017 
em outro anexo. 


MATERIAIS E MÉTODOS 


O capítulo do livro utiliza dados de múltiplas fontes divididas em dois tipos de 
pesquisa, históricas de Rondônia e técnicas sobre o sistema elétrico de caráter descritivo 
e exploratório sobre os assuntos abordados. 

Para a elaboração do histórico de Rondônia todos os documentos consultados 
são de fontes governamentais que apresentam a história do estado e outros trabalhos 
que apresentam informações complementares sobre formação, migrações decorrentes e 
eventos históricos como construção da estrada de ferro e os ciclos da borracha. 

Isso inclui outros textos originalmente sobre comunidades ribeirinhas que podem 
atribuir mais valor comentando sobre hidrelétricas e rios, a construção de estrada de ferro 
e migrações decorrentes desse projeto por outros trabalhos acadêmicos. 

A parte elétrica é composta de textos técnicos que descrevem o funcionamento de 
certas máquinas elétricas como motores em associação a outras máquinas elétricas como 
bobinas e pistões associado a diferentes tipos de geração e como elas são encontradas em 
Rondônia, assim como os principais atores responsáveis por supervisionar a rede elétrica 
nacional. 

Na rede de distribuição uma extensa pesquisa é elaborada usando dados fornecida 
pela ANEEL em seu site ou pesquisas similares a desse trabalho com estatísticas relevantes 
sobre consumo e investimentos no setor de distribuição elétrica em Rondônia. Cálculos 
sobre taxa de crescimento foram aplicados sobre os dados utilizados a fim de melhor 
observar os valores de cada categoria individualmente realçando pontos de interesse para 
discussão. 
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CONSIDERAÇÕES FINAIS 


Rondônia apresenta um perfil único para seu crescimento originalmente isolado e 
de pouco interesse do governo teve seu valor encontrado com o potencial de geração 
energético anos mais tarde. O aumento do consumo pela população e como essa energia 
é utilizada em todos os setores demonstraram claro crescimento da rede física sendo 
expandida pela concessionaria motivada por programas do governo como Luz para todos, 
assim como uma crescente base de clientes novos que são conectados todo ano. 

Portanto, a forma como essa energia tem sido consumida também deixou claro que 
o aumento não foi apenas na quantidade de pessoa, mas como cada indivíduo consome 
mais energia, isso reflete a realidade de um estado em crescimento em que não é apenas 
a quantidade de clientes, mas o aumento da qualidade do nível de vida. 
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ANEXOS 


Anexo A — Tabela de consumo dos municípios 


Região (consumo)| 2007 2008 2009 2010 2011 2012 2013 2014 2015 
Alta Floresta | 71492 | 17689 | 18.642 | 20.486 | 21.161 | 23.309 | 25.154 | 26.412 | 28.206 
D'Oeste 
ao 5.549 | 6.176 | 6930 | 7.666 | 7977 | 8799 | 9346 | 10.414 | 10.497 
Alto Paraíso | 10.136 | 12.163 | 13.231 | 13.802 | 14.932 | 17.060 | 17.685 | 20.217 | 19.369 
Alvorada D'Oeste | 11.495 | 12.241 | 12.932 | 14.929 | 15.499 | 16.530 | 17.062 | 18.026 | 18.545 
Ariquemes | 133.005 | 141.846 | 146.949 | 164.658 | 181.898 | 212.445 | 200.796 | 226.656 | 218.585 
Buritis 24218 | 24.517 | 24987 | 28277 | 31.097 | 33.417 | 37.373 | 40.511 | 40.056 
Cabixi 4923 | 5.333 | 5.649 | 6418 | 6893 | 7.508 | 8196 | 9161 | 9.441 
Cacaulândia 3.306 | 3.568 | 3868 | 4331 | 4634 | 5.145 | 5.466 | 5.743 | 5.998 
Cacoal 103.417 | 107.890 | 113.726 | 125.241 | 134.544 | 144.646 | 147.363 | 162.623 | 172.013 
Campo Novo de 
ondiiia 2741 | 3.359 | 4271 | 5113 | 5.742 | 6510 | 7424 | 7.747 | 8.060 
pets do | 42660 | 13300 | 14081 | 16373 | 19067 | 25.116 | 26.390 | 27.768 | 29.707 
Castanheiras | 1425 | 1715 | 1881 | 2015 | 2175 | 2287 | 2557 | 3134 | 3.979 
Cerejeiras 16.922 | 18.069 | 19.337 | 21.161 | 22493 | 24396 | 24,534 | 28041 | 28.960 
Chupinguaia 7.415 | 8.997 | 9.847 | 13.941 | 18.173 | 22280 | 19.344 | 20.775 | 22.948 
Colorado do Oestel 19.194 | 20.147 | 21.520 | 22019 | 22635 | 24283 | 24443 | 26.061 | 27.285 
Corumbiara 4007 | 5.651 | 6259 | 6939 | 7.266 | 7.957 | 8367 | 9654 | 10.032 
Costa Marques | 9.156 | 9.888 | 10032 | 10.224 | 11.265 | 12.574 | 13.420 | 14.617 | 14.816 
Cujubim 11.979 | 14.014 | 16.365 | 18.007 | 19.516 | 21.279 | 20.457 | 22277 | 22.683 
Espigão D'Oeste | 33.406 | 34.144 | 40.627 | 44.501 | 47.436 | 50.261 | 52.114 | 58.758 | 61.739 
qa Jorge] sess | 5934 | 6365 | 6770 | 7122 | 7515 | 7726 | 6073 | Bai 
eixeira 
Guajará-Mirim | 32.803 | 33.711 | 35.358 | 38.905 | 41.338 | 45.695 | 48.025 | 50.552 | 52.121 
ltapuã do Oeste | 13.067 | 17.101 | 14.796 | 16.459 | 21.214 | 25.459 | 22592 | 23.366 | 50.051 
Jaru 81.528 | 87.821 | 89.366 | 95.442 | 101.721 | 113.910 | 112.900 | 115.132 | 117.934 
Ji-Paraná 157.795 | 171.771 | 185.271 | 195.911 | 200.248 | 222.478 | 226.314 | 248.670 | 253.724 
as 19.250 | 18.227 | 19.571 | 23057 | 26091 | 32507 | 31.936 | 36.580 | 36.517 
Ministro 
dia 5.521 | 6.152 | 6350 | 7059 | 7374 | 8170 | 8523 | 9496 | 9.780 
Mirante da Serra | 8.556 | 8877 | 9.618 | 10.396 | 10.964 | 11.864 | 12.482 | 13.133 | 13.845 
Monte Negro | 9029 | 9.672 | 10.224 | 11.296 | 12.142 | 13.756 | 14479 | 16.237 | 15.447 
doada 10.768 | 13.136 | 13.342 | 14672 | 15.302 | 16.739 | 17.883 | 18.796 | 19.182 
Nova Mamoré | 12.255 | 13.129 | 13.694 | 15.502 | 17.317 | 22296 | 23.271 | 24.761 | 26.755 
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Nova União 4010 | 4315 | 4711 | 5.296 | 5463 | 5.843 | 5966 | 4960 | 6.473 
Novo e do) 537 | 7061 | 6698 | 7264 | 7687 | 7943 | 8381 | 9077 | 9.520 
Ni ba do | 43.286 | 44.151 | 46.138 | 49.455 | 51.972 | 56.241 | 57.736 | 61.333 | 61.559 
Parecis 2235 | 1998 | 2487 | 2613 | 2824 | 3130 | 3514 | 3905 | 5.484 
Pimenta Bueno | 44.773 | 46.731 | 55.303 | 60.224 | 63.469 | 68.834 | 72047 | 78.391 | 80.568 
au do | 128 | 1287 | 1560 | 1880 | 2081 | 2297 | 2406 | 2509 | 2701 
Porto Velho | 477.227 | 512.276 | 595.067 | 742.384 | 825.242 | 982.327 |1.068.790|1.104.875| 1.027.822 
Presidente Médici) 20.312 | 20.221 | 21.325 | 22681 | 23.918 | 25522 | 26.944 | 30.359 | 31.746 
Primaverade | cog2 | 2397 | 2980 | 3218 | 3337 | 3663 | 4006 | 4.187 | 4494 
Rondônia 
Rio Crespo 2327 | 2792 | 3524 | 4941 | 5.163 | 4242 | 4923 | 5998 | 2.777 
Rolim de Moura | 67.959 | 68.087 | 70495 | 77.078 | 92.546 | 108.514 | 114.796 | 125.580 | 122.885 
anteiEuiaia 6227 | 7222 | 8899 | 9.166 | 9383 | 10.213 | 10.690 | 11.328 | 11.101 
D'Oeste 
São Felipe 
a 2905 | 3.553 | 4200 | 4256 | 4334 | 4593 | 4812 | 1.901 | 5.440 
São Francisco do | 19975 | 11050 | 11.812 | 12.363 | 14077 | 15.188 | 16.266 | 18925 | 19.823 
Guarporé 
São Migueldo | 45476 | 13070 | 17572 | 21.378 | 21.836 | 23501 | 57.156 | 36.566 | 37.506 
Guaporé 
Seringueiras | 7.199 | 7.493 | 8080 | 9.328 | 10.211 | 11.345 | 12521 | 12.841 | 13.577 
Teixeirópolis 3.512 | 3737 | 4051 | 4476 | 4954 | 5.169 | 5.288 | 6226 | 6317 
Theobroma 6.505 | 7002 | 7.506 | 8202 | 8675 | 9415 | 9.961 | 10.546 | 11.280 
Urupá 8.263 | 8832 | 9.534 | 10.317 | 11.002 | 11.497 | 12.154 | 13.420 | 13.747 
ValedoAnari | 3.951 | 4448 | 4988 | 5485 | 6349 | 7.045 | 6662 | 7.195 | 13.747 
valedo Paraiso | 5.351 | 5648 | 5.708 | 6066 | 6423 | 6865 | 7.334 | 7.708 | 7.819 
Vilhena 101.308 | 113.044 | 119.183 | 127.552 | 135.008 | 153.503 | 158.639 | 165.726 | 176.160 
Rondônia — |1.627.456]1.742.653|1.906.910|2.177.193|2.371.125]2.713.081|2.864.614]3.024.947|3.029.152 
Engenharia elétrica e de computação tecnologia em evolução Capítulo 2 


38 


Anexo b — Tabela de consumo 2007 a 2017 


Residencial 579.235 619.770 685.006 793.954 875.462 | 1.060.690 | 1.084.000 | 1.157.000 | 1.177.000 | 1.151.499 | 1.225.446 
Industrial 271.058 300.797 320.708 394.085 432.204 603.134 599.000 553.000 450.000 388.944 320.771 
Comercial 371.994 387.879 426.766 480.268 527.470 457.204 606.000 642.000 653.000 627.581 629.835 
Rural 154.164 171.144 188.778 208.048 229.592 249.313 264.000 286.000 305.000 311.149 325.764 
Poder Público 134.288 138.985 151.604 163.489 172.350 195.237 199.000 208.000 224.000 220.113 225.066 
Iluminação Pública 66.832 71.544 79.368 83.990 82.532 91.604 123.000 130.000 131.000 133.664 135.687 

Serviço Público 46.638 49.228 50.852 49.529 47.825 52.009 49.000 49.000 59.000 50.599 52.352 

Próprio 3.294 3.307 3.891 3.891 3.695 3.893 6.000 7.000 8.000 5.467 5.352 
Total 1.627.452 | 1.742.655 | 1.906.913 | 2.177.194 | 2.371.129 | 2.713.084 | 2.930.000 | 3.032.000 | 2.997.000 | 2.889.016 | 2.920.273 


Anexo c — Tabela de clientes 2007 a 2017 


Residencial 302.779 | 316.788 | 330.604 | 345.677 | 364.927 | 391.281 402.119 | 415.354 | 423.404 | 439.160 | 458.222 
Industrial 2.252 2.213 2.138 2.125 2.108 2.165 1.977 1.970 1.920 1.824 1.685 
Comercial 30.722 31.970 33.808 35.407 36.868 38.258 38.382 39.141 39.168 39.842 40.456 

Rural 76.598 82.304 85.959 94.801 104.315 | 112.030 | 117.344 | 119.198 | 119.529 | 122.917 | 127.190 
Poder Público 3.470 3.712 3.811 4.002 4.217 4.273 4.501 4.598 4.675 4.664 4.703 
Iluminação Pública 158 162 175 184 191 222 246 273 281 281 280 
Serviço Público 187 203 207 196 202 204 214 214 226 252 267 
Próprio 115 119 122 128 121 120 118 120 138 140 142 
Total 416.276 | 437.471 | 456.824 | 482.515 | 512.949 | 548.553 | 564.892 | 580.868 | 589.341 | 609.080 | 632.945 
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Anexo d — mapa de subestações de rondônia 2022. 
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Anexo E — mapa UNIFILAR de Rondônia 2017. 
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RESUMO: O estudo investiga a viabilidade técnica e econômica do investimento em energia 
solar fotovoltaica para uma indústria, em conformidade com a Resolução Normativa da 
ANEEL nº 482. Com base em análises financeiras, o investimento de R$ 170.000,00 resultou 
em um payback descontado de 5 anos e 8 meses, uma taxa interna de retorno de 20,13%, 
e um valor presente líquido positivo de R$ 299.192,39, indicando viabilidade econômica. 
Comparado à poupança, o investimento é mais atrativo, proporcionando retorno financeiro 
superior. Além da energia solar, outras fontes de energia limpa: como eólica, biomassa e 
hidrelétrica são consideradas como alternativas de investimento, dependendo das condições 
locais e das necessidades energéticas do consumidor. O estudo visa analisar dados reais de 
2013 até o início da pandemia em estados do sul do Brasil, utilizando o software Power Bl, 
para inferir conclusões relevantes nesse período. Este artigo se encerra com uma conclusão 
das inferências obtidas e sugere futuros trabalhos 

PALAVRAS-CHAVE: Energia solar, Energia Limpa Renovável, Análises dados 


ANALYSIS OF REAL DATA FROM 2013 TO THE ONSET OF THE PANDEMIC 
ON THE EVOLUTION OF CLEAN ENERGY SOURCES USING BUSINESS 
INTELLIGENCE WITH POWER Bl: SOUTHERN REGION OF BRAZIL 
ABSTRACT: The study investigates the technical and economic feasibility of investing in 
photovoltaic solar energy for an industry, in accordance with ANEEL Resolution Normative No. 
482. Based on financial analyses, the investment of R$ 170,000.00 resulted in a discounted 
payback period of 5 years and 8 months, an internal rate of return of 20.13%, and a positive 
net present value of R$ 299,192.39, indicating economic viability. Compared to savings, the 
investment is more attractive, providing a superior financial return. In addition to solar energy, 
other sources of clean energy such as wind, biomass, and hydropower are considered as 
investment alternatives, depending on local conditions and consumer energy needs. The 
study aims to analyses real data from 2013 until the beginning of the pandemic in southern 
states of Brazil, using Power Bl software, to draw relevant conclusions during this period. This 
article concludes with a summary of the inferences drawn and suggests future work. 

KEYWORDS: solar; renewable clean energy; Data Analysis 


INTRODUÇÃO 


Uma das transformações mais significativas da sociedade urbana desde o início do 
período de industrialização é o aumento do consumo de recursos, como matérias-primas 
e energia. Desse contexto de consumo crescente, emergem indicadores cruciais que 
possibilitam a formulação de estratégias para o desenvolvimento sustentável, num cenário 
paradoxal em que o progresso não garante, necessariamente, a sustentabilidade a longo 
prazo (Chen, 2024). 

Entre esses indicadores, destacam-se a viabilidade técnica, econômica e social das 
fontes energéticas. Assim, é de suma importância construir e validar análises relacionadas 
à produção de energia limpa e sustentável, especialmente nos setores capazes de 
demonstrar seu desempenho conforme esses critérios de viabilidade. 
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Estudos que abordam os impactos ambientais da geração de energia limpa são 
relevantes e demandam uma organização complexa das atividades humanas (Fernandes 
et al., 2020), contudo, não são o foco deste trabalho. Portanto, uma análise crucial que 
certamente contribuirá para o planejamento relacionado à energia limpa e sustentável é 
compreender em que medida e como ocorre a evolução da produção nos principais setores 
desse tipo de energia. 

Já o setor industrial no Brasil figura como um dos maiores consumidores de energia 
elétrica, absorvendo cerca de 35% do consumo total em 2022, conforme dados da Agência 
Nacional de Energia Elétrica (ANEEL). Esse elevado consumo tem um impacto significativo 
nos custos das indústrias, visto que, no mesmo ano, o custo da energia elétrica representou 
11,4% dos custos totais de produção das empresas industriais brasileiras, conforme 
apontado pela Confederação Nacional da Indústria (CNI, 2022). 

Além disso, o Brasil enfrenta o desafio de ter uma das tarifas de energia elétrica mais 
elevadas do mundo, superando países como França, Canadá, México e Estados Unidos, o 
que encarece ainda mais o processo fabril e motiva as empresas a buscarem alternativas para 
mitigar esses custos (CNI, 2021). Essa realidade se tornou mais evidente em 2021, quando o 
país atravessou um período de estiagem que se estendeu até meados de 2022 (FIEP, 2022). 
Uma pesquisa industrial realizada no final de 2021 revelou que o terceiro trimestre do mesmo 
ano foi marcado por uma intensa pressão nos custos industriais, incluindo os custos com 
energia elétrica, o que afetou a recuperação econômica (FIEP, 2022). 

Diante desse cenário, o Brasil apresenta uma vantagem natural para diversificar 
sua matriz energética, especialmente por meio da geração fotovoltaica. A implementação 
da geração distribuída no ponto de consumo, utilizando painéis fotovoltaicos instalados 
nas próprias empresas, emerge como uma opção viável. Essa abordagem não apenas 
alinha-se às diretrizes de planejamento energético da ANEEL, mas também contribui para 
o incremento esperado da participação da energia solar na matriz energética, passando de 
2,4% para 3,5% até 2025, de acordo com o Operador Nacional do Sistema Elétrico (ONS, 
2021). 

Nesse contexto, a presente pesquisa tem como objetivo investigar a viabilidade 
técnico-econômica do uso de um sistema fotovoltaico (SFV) na modalidade de geração 
distribuída (GD), destacando sua contribuição para uma unidade tarifada no grupo B. 

Além da energia solar fotovoltaica, outras fontes de energia limpa que merecem 
consideração para empresas industriais incluem: 

Energia eólica: Aproveitamento da energia cinética do vento para gerar eletricidade. 


Energia hidrelétrica: Utilização do fluxo de água em rios para produção de energia 
elétrica. 


Biomassa: Conversão de resíduos orgânicos em energia, como bagaço de cana-de- 
açúcar ou resíduos agrícolas. 


Engenharia elétrica e de computação tecnologia em evolução Capítulo 3 


45 


GERAÇÃO DISTRIBUÍDA NO BRASIL 


Essas fontes, quando combinadas com estratégias de eficiência energética, podem 
ajudar a reduzir os custos operacionais das indústrias, além de contribuírem para a 
sustentabilidade ambiental. 

Conforme as disposições estabelecidas pela Resolução Normativa da ANEEL nº 
482/2012, posteriormente modificada pela Resolução Normativa da ANEEL nº 687/2015, 
os consumidores têm permissão para instalar geradores em suas unidades consumidoras 
e utilizar o sistema elétrico da concessionária de energia elétrica para injetar o excedente 
de energia gerada. Esse excedente é convertido em créditos de energia válidos por 60 
meses, os quais podem ser utilizados para abater o consumo da própria unidade nos meses 
seguintes ou de outras unidades consumidoras previamente cadastradas e atendidas pela 
mesma distribuidora, desde que tenham o mesmo titular. 

O conceito de autoconsumo remoto refere-se a unidades consumidoras de mesma 
titularidade que possuem uma unidade consumidora com microgeração distribuída em local 
diferente das demais unidades consumidoras. 

Para unidades consumidoras conectadas em baixa tensão (grupo B), mesmo que 
a energia injetada na rede seja superior ao consumo, é devido o pagamento referente ao 
custo de disponibilidade. A Figura 1 abaixo ilustra o sistema de compensação de energia e 
as partes envolvidas. 


Grupo À: paga apenas à parcela referente à de 
Grupo B: paga apenas to de disponibilidade 


Figura 1 — Sistema de Compensação de Energia 
Fonte: (ANEEL, 2016) 


Mesmo com dados de aproximadamente 4 anos, no estado em análise, a energia 


solar é responsável por quase 95%. Posto isso, apesar de outras fontes serem citadas, a 
solar deverá ter maior enfoque. 
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De um modo geral, as empresas buscam reduzir custos operacionais, e umas das 
formas de atingir esse objetivo é investindo em energia solar. Tendo em vista a dificuldade 
em planejar investimentos nessa área, administradores procuram estudar técnicas de 
análise para viabilizar projetos dessa natureza. 

O objetivo desse tópico é revisar trabalhos já publicados com assuntos correlatos a 
pesquisa referente a viabilidade técnica financeira da implantação da energia solar em uma 
unidade consumidora. 

De acordo com Souza e Penha (2020), durante o desenvolvimento de estudo de 
viabilidade econômica de um projeto solar, constataram que o investimento inicial de R$ 
51.200,00 reais se apresentou viável, com payback positivo em 4 anos, TIR de 30% e VPL 
positivo de R$ 332.000,00 em 15 anos, onde a maior dificuldade encontrada foi o alto valor 
inicial de investimento. Foi utilizada a TMA de 5%, a mesma utilizada na análise da Sulfiltros. 

Um estudo realizado em uma unidade hoteleira em Tapes, RS, na concessionária 
CEEE, custo inicial de R$ 144.000,00 reais, gerando 4.000 kWh/mês, o payback positivo foi 
de 4 anos e 7 meses, TIR de 12,64%, maior que a TMA de 10% (Abel et al., 2019). 


MATERIAIS E MÉTODOS: POWER BI DESKTOP: 


O Power BI Desktop é a versão gratuita da ferramenta, permitindo conectar- 
se a várias fontes de dados, importar, transformar e modelar dados, criar visualizações 
interativas e realizar análises avançadas. Já o Power BI Pro é a versão paga, oferecendo 
recursos extras de colaboração, segurança e integração com outros serviços da Microsoft. 
Ambas as versões têm vantagens como facilidade de uso, ampla conectividade de dados e 
capacidade de compartilhamento e colaboração. Em resumo, são ferramentas poderosas 
para análise de dados e geração de relatórios. 

A versão empregada no desenvolvimento dessa pesquisa foi a desktop. 

Na seção de resultados, para clarificar o texto, os dados empregados na geração 
das respectivas figuras são: os anos de 2013 a 2020, com a potência total gerada por meio 
de energia limpa aplicados na Figura 2, já a Figura 3 fez um gráfico de setores com todos os 
tipos de energia limpa analisados, finalmente a Figura 4, mostrou por setores o crescimento 


da energia solar, a qual foi amplamente maior. 


DESENVOLVIMENTO 


O crescimento da energia limpa é fundamental para o planeta por várias razões 
importantes: 

Redução das Emissões de Gases de Efeito Estufa: As fontes tradicionais de energia, 
como o carvão e o petróleo, são responsáveis por uma grande parte das emissões de gases 
de efeito estufa que contribuem para as mudanças climáticas. O uso de energias limpas, 
como solar, eólica e hidrelétrica, ajuda a reduzir essas emissões, ajudando a mitigar o 
aquecimento global. 
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Preservação dos Recursos Naturais: O uso de energia limpa geralmente envolve 
recursos renováveis, como a luz solar, o vento e a água. Ao contrário dos combustíveis 
fósseis, esses recursos são virtualmente inesgotáveis e não se esgotam com o tempo. Isso 
ajuda a preservar os recursos naturais do planeta para as gerações futuras. 

Diversificação da Matriz Energética: Dependência excessiva de uma única fonte de 
energia pode ser arriscada do ponto de vista econômico e ambiental. Diversificar a matriz 
energética com fontes limpas oferece maior segurança energética e reduz a vulnerabilidade 
a interrupções de abastecimento e oscilações de preços. 

Criação de Empregos e Estímulo Econômico: A transição para a energia limpa 
também pode estimular o crescimento econômico e a criação de empregos. Setores 
como energia solar, eólica e de tecnologia verde estão em expansão e oferecem 
oportunidades de emprego em áreas como engenharia, instalação, manutenção e pesquisa 
e desenvolvimento. 

Melhoria da Saúde Pública: A queima de combustíveis fósseis para geração de 
energia está associada à poluição do ar e à liberação de poluentes prejudiciais à saúde, 
como partículas finas e óxidos de nitrogênio. Ao mudar para fontes de energia limpa, 
podemos reduzir esses impactos negativos na saúde pública e melhorar a qualidade do ar 
em nossas comunidades. 

Uma estimativa de necessidade de crescimento de geração de energia no Brasil no 
período de análise é de 

2013: Aproximadamente 483.000 GWh 

2014: Aproximadamente 495.000 GWh 

2015: Aproximadamente 505.000 GWh 

2016: Aproximadamente 510.000 GWh 

2017: Aproximadamente 520.000 GWh 

2018: Aproximadamente 530.000 GWh 

2019: Aproximadamente 540.000 GWh 

2020: Aproximadamente 550.000 GWh 

De acordo com o Ministério de Minas e Energia do Brasil ou a Agência Nacional de 
Energia Elétrica (ANEEL). 
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RESULTADOS 


A Figura 2 mostra a evolução do crescimento da energia limpa, ao longo dos 
anos fornecidos pela massa de dados, ressalta-se que facilita a inferência da soma do 


crescimento. 


Soma de Potência AN 


um 
Aro 


Figura 2 —Crescimento da Geração Energia Limpa 


Fonte: Próprio Autor 


Já a Figura 3 mostra, por meio de um gráfico de setores apresenta um maior 
percentual da geração da energia solar comparada as demais. 

Esse resultado certamente foi obtido devido a pandemia. Devido a mesma, com a 
maior permanência das pessoas em suas residências, devido a mudança de comportamento 
nesse período, pode-se observar um crescimento acentuado nesse de 2019 a 2020. Outra 
observação relevante foi a estagnação da indústria nessa época, observa-se que é indústria 
de um modo geral e não indústrias especificas, como as de máscaras por exemplo. 
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Figura 3 — Percentual das fontes de energia 


Fonte: Próprio Autor 


Além das observações supracitadas uma tendência de crescimento da energia solar 
pode ser observada, considerando todos os setores, como por exemplo o rural 

E, finalmente a tendência de crescimento (linha preta) apresentada na figura 4 tem 
um comportamento linear de 2015 a 2020, com um comportamento similar ao do país. 
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Figura 4 — Crescimento da Energia Solar em diferentes setores 


Fonte: Próprio Autor 
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CONCLUSÃO 


Os resultados foram de surpreendentes analisando somente a massa de dados 
da planilha. Promissores, como se espera um crescimento da energia limpa, em especial 
na base analisada, de um estado que tem boa incidência solar, diferentemente de outras 
regiões como o Nordeste com 506 parques na atualidade, que viabiliza a energia eólica 
devido a presença de regiões com deslocamentos de ar. 

Desse modo a crescente demanda por energia limpa, em particular a energia solar, 
reflete uma consciência global crescente sobre os impactos negativos das fontes tradicionais 
de energia, como o carvão e o petróleo, no meio ambiente e na saúde humana. A transição 
para a energia solar não é apenas uma necessidade urgente para mitigar as mudanças 
climáticas e reduzir as emissões de gases de efeito estufa, mas também representa uma 
oportunidade significativa para impulsionar o desenvolvimento sustentável, criar empregos 
e promover a independência energética. 

Futuros trabalhos, dados mais recentes, e endereçam analisar outras regiões do 
país e objetivar uma correlação entre os mesmos 
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RESUMO: Este artigo propõe um método 
de sintonização dos coeficientes de um 
controlador PID através de uma rede 
neural em um sistema microcontrolado 
embarcado. Esta arquitetura de controlador 
neuro-adaptativo se destaca em aplicações 
não lineares e com constante mudança 
de dinâmica da planta, neste caso, 
a bancada MAGLEV. A Bancada de 
suspensão magnética possui diversas 
aplicações na indústria, tais como: trens 
de alta velocidade, rolamentos magnéticos, 
dissipadores de vibrações, suspensões 
magnéticas etc. O desenvolvimento da 
pesquisa se dará da seguinte maneira: 
primeiramente será realizado um estudo 
acerca da planta e da arquitetura da rede 
neural a ser utilizada e informações sobre 
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o hardware de processamento, tendo 
estes dados adquiridos dá-se início do 
design e construção dos algoritmos para 
o projeto, somando todas as ferramentas 
desenvolvidas, começará o processo de 
implementação dos códigos na bancada de 
suspensão magnética e a comparação com 
um controlador PID clássico. Validando o 
desempenho deste método de sintonização, 
todos recursos gerados durante as 
pesquisas serão disponibilizados no GitHub 
para a comunidade. 
PALAVRAS-CHAVE: 
Controle adaptativo, 
Artificiais, MAGLEV. 


Microcontroladores, 
Redes Neurais 


NEURO-ADAPTATIVE PID CONTROL 
ENBEDDED IN A MAGLEV SYSTEM 


ABSTRACT: The present paper proposes 
a PID controller tunning method based on 
an artificial neural network, implemented in 
an embedded microcontroller system. The 
neuro-adaptative controller architecture 
is known for its efficiency in non-linear 
models, with constant parameter changes, 
in this case, a MAGLEV device. Use largely 
spread in industrial fields such as: high- 
speed magnetic levitation trains, magnetic 
bearings, vibration dampers etc. The 
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research will be presented in the following sequence: study of the non-linear model, definition 
of the neural network architecture, evaluation of the hardware specifications, and with that 
data, the algorithm of the neuro-adaptative controller will be developed, alongside from the 
firmware. Completed those steps, the test and implementation stage of the proposed control 
method will begin, reaching its validation through comparison with a classical PID controller. 
All resources built from this project will be available to all the community in GitHub. 
KEYWORDS: Microcontrollers, Adaptative Control, Artificial Neural Network, MAGLEV. 


INTRODUÇÃO 


A necessidade da contínua melhoria de qualidade no setor industrial fomenta a 
constante busca e pesquisa de técnicas de otimização dos seus processos e setores. 
Métodos de controle surgiram na década de 20 (PARK, 2017) e se tornaram importantes 
ferramentas na indústria no controle de processos. Com a sua implementação busca-se a 
redução das não conformidades dos procedimentos e ou produtos ali fabricados, fatores, 
influentes nos quesitos econômicos e comerciais da empresa (BRISK, 2015). 

Os controladores são amplamente utilizados em processos de automação da indústria 
no controle de sistemas (OGATA, 2010). Sendo o PID (proporcional integral derivativo), o 
mais utilizado na indústria, facilmente aplicado a plantas lentas e com poucos requisitos de 
performance (RIVAS-ECHEVERRIÍA; RÍOS-BOLÍVAR; CASALES-ECHEVERRÍA, 2001). O 
controlador PID apresenta suas limitações quando a planta possui características como: não 
linearidades, alta sensibilidade, alta complexidade, perturbações externas significativas e 
alteração da sua dinâmica e parâmetros conforme o tempo (Bl; YING; YONGQUAN, 20083). 

Na medida que técnicas de controle e algoritmos novos foram surgindo, o nível 
de complexidade dos processos e plantas controlados pôde avançar. Entretanto as 
características: não lineares, modelos de difícil estimação, constante mudança de 
parâmetros e alta sensibilidade, alinhadas aos requisitos de: precisão, velocidade e 
robustez, exigem hardwares com capacidades de entregar mais operações de cálculo, 
processadas ainda mais rapidamente (ATHANS, 1966). A possibilidade de implementação 
destes controladores em dispositivos embarcados é altamente relevante, visto que o 
determinismo das informações em alguns tipos de processos é indispensável. Somando 
os fatores mencionados anteriormente a capacidade execução do controlador em um 
equipamento de baixo custo através de otimizações e criação de novos métodos de 
abordagem são fundamentais, uma vez que, do ponto de vista comercial é um campo 
atrativo (ATHANS, 1966). 

Neste artigo será abordado um método de controle neuro-adaptativo baseado em 
um controlador PID, onde, seus ganhos serão atualizados por uma rede neural adaptativa 
embarcada. Em (HERNÁNDES-ALVARADO et al, 2016) tem-se uma abordagem similar, 
entretanto os procedimentos de cálculo dos parâmetros atualizados serão feitos de maneira 
totalmente embarcada em um microcontrolador de baixo custo. 
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CONTROLE ADAPTATIVO 


Por definição, os controladores adaptativos, possuem parâmetros que podem ser 
ajustados na tentativa de melhor adaptarem-se as não linearidades e constante mudança 
das plantas, assim como um mecanismo de fazê-lo (FIDAN; IOANNOU, 2006). A seleção 
do tipo de controlador e mecanismo é um processo determinante para a qualidade final do 
controle empregado. 

Dentre as primeiras técnicas de controle adaptativo desenvolvidas temos os ganhos 
escalonados, derivado dos pilotos automáticos e controladores de voo do final da segunda 
guerra mundial (LEMOS; MARTÍN-SÁNCHES; RODELLAR, 2012). Este método consiste 
em identificar a não linearidade da planta, linearizá-la, gerar uma curva e escolher pontos 
de interesse nesta curva para sintonizar diferentes controladores, respectivamente (RUGH; 
SHAMMA, 2000). O número de pontos e a proximidade entre eles é um fator importante a 
ser observado, pois, quando o controlador estiver atuando em regiões distantes do ponto 
em que seus coeficientes foram determinados, a ação da não linearidade será alta (LEITH; 
LEITHEAD, 2010). Exemplificado na Figura 1. 


150 


100 


Ri 
GANHOS 1 
50 | R2 
GANHOS 2 
R3 E q GANHOS 3 


0 1 2 3 4 5 


Figura 1: Curva de linearização. 


Fonte: autoria própria. 


Na abordagem por ganhos escalonados assume-se que a não linearidade é 
conhecida e pode ser modelada, o que não é verdade para todos os tipos de plantas 
(ELKHATEM; ENGIN, 2023). Para sistemas cujo as incertezas são desconhecidas ou de 
difícil modelagem, novas técnicas de controle adaptativo foram criadas. 

Os avanços tecnológicos na área da computação possibilitaram a exploração novos 
algoritmos, que cada vez mais complexos, se tornaram capazes de contornar as incertezas 
desconhecidas. O uso de redes neurais adaptativas popularizou-se ao final da década de 
80, sua capacidade de identificar padrões não lineares e adaptabilidade atraíram interesse 
da comunidade em aplicações de controle adaptativo, surgindo assim o termo: controle 
neuro-adaptativo (FIDAN; IOANNOU, 2006). 
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Controle neuro-adaptativo 


As redes neurais artificiais, Figura 2 podem ser conceituadas como uma função 
matemática de tamanho e complexidade ajustáveis, que possuem a capacidade de se 
adaptar às situações problemas. Sua construção e princípio de funcionamento foram 
inspiradas no cérebro humano, dado essa similaridade, também recebem o nome de 
perceptron multicamadas (WERBOS, 1988), Figura 83. 


Figura 2: Estrutura da rede neural artificial. Figura 3: Perceptron de Rosenblatt 
Fonte: autoria própria. Fonte: autoria própria. 


Os controladores neuro-adaptativos possuem duas principais arquiteturas: a rede 
neural substitui o controlador e suas saídas são as ações de controle, Figura 4, observado 
em (KANG; et al, 2014) (Bl; YING; YONGQUAN, 2003), ou a rede neural realiza a 
sintonização de um controlador, Figura 6, seja qual for sua estrutura (RIVAS-ECHEVERRÍA; 
RÍOS-BOLÍVAR; CASALES-ECHEVERRIÍA, 2001) (HERNÁNDES-ALVARADO et al, 2016). 


U = Planta Y 


> RNA [>>> E 


Figura 4: Controlador PID substituído por RNA. 


Fonte: autoria própria. 


A principal distinção entre os modelos é a certificação de um critério de estabilidade 
do controlador. No primeiro caso, Figura 4, o autor (KANG; et al, 2014) avalia a estabilidade 
utilizando a função de Lyapunov em conjunto com as equações de cálculo da variação dos 
pesos da rede neural. Contudo, no segundo caso, Figura 6, a estabilidade do sistema é 
garantida na sintonização dos controladores PID utilizados no aprendizado da rede neural 
(HERNÁNDES-ALVARADO et al, 2016). O modelo no qual o controlador é sintonizado 
por uma rede neural, e não substituído, há uma flexibilidade na escolha da arquitetura do 
controlador a ser sintonizado e em qual momento os seus ganhos serão atualizados. 
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CONTROLADOR NEURO-ADAPTATIVO PROPOSTO 


O controlador neuro-adaptativo proposto neste artigo, consiste em um sistema 
totalmente embarcado para identificação em tempo real dos parâmetros de um controlador 
PID com filtro derivativo de primeira ordem, através de uma rede neural artificial. Com uma 
lei de controle definida como: 


1 s 
=1Kk,+K-+Ka-——- |E 
Ucs) ( p + Es” Tor) (s) (1) 


A rede neural, Figura 5, baseada no modelo de (HERNÁNDES-ALVARADO et 
al, 2016), é construída a partir do arquétipo do controlador acima, sendo: ks ks Ke T, 


s 


correspondente as suas saídas. Suas entradas são: os erros (referência - saída da planta) 
Eis +14 àS ações de controle us a saídas da planta (valor lido pelo sensor) PR m 


nos tempos indicados entre colchetes. 


Figura 5: Rede neural implementada. 


Fonte: autoria própria. 


Além de entradas e saídas, a rede neural requer a definição de mais alguns 
parâmetros globais, são eles: número de camadas ocultas e respectivos tamanhos, 
coeficiente de aprendizado e funções de ativação de cada camada. 

Assim como elaborado (RASHID, 2016), a rotina feedfoward é desenvolvida através 
de operações algébricas entre as matrizes de pesos. Seguindo o modelo de perceptron 
de Rosenblatt (ROSENBLATT, 1958), Figura 3, agrupa-se os pesos a fim de facilitar a 
propagação dos sinais pela rede. Observando a Figura 3 constate-se que a saída de cada 
nó é dada por: 
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l 


y=0 D+ rum (2) 


k=1 


No qual: x, são as | entradas, multiplicadas por suas respectivas intensidades de 
sinais w,, b representa um bias e por fim é aplicado uma função de ativação, neste caso a 
sigmoide o. Expandindo para toda a rede mediante álgebra de matrizes, temos que o vetor 
de saídas Y, de cada camada i podem ser descritas como: 


Ya = 0n(MWaXn + Ba) (3) 


A matriz w, possui o seguinte formato: 


Woo Wi 

Wig=| 0 (4) 
Woj ... Wi; 

eamatriz B;: 
bo 

e 

ici — |, (5) 
b; 


Sendo io índice dos nós da camada ne jo das entradas X.. 


Procedimento de treinamento da rede neural 


O formato de treinamento utilizado nesta proposta de controlador neuro-adaptativo 
é do tipo supervisionada, ou seja, os ganhos da rede são ajustados conforme um conjunto 
de dados informados pelo usuário (entradas e saídas esperadas). 

Antes de definir-se o algoritmo backpropagation, responsável pela correção do valor 
de cada peso da rede neural, dado um valor de erro, é necessário realizar o cálculo do 
erro e sua projeção em cada camada. Descrito abaixo, o erro da camada é resultado 
da: multiplicação escalar da matriz de pesos transposta da camada , pela operação de 
multiplicação de Hadamard, simbolizada por O, com a derivada da função de ativação: 

En = wi En O d0(Y,) (6) 

e para a última camada: 

Enmar E Eisninado = O d0(Yamax) (7) 


Considerando os pesos w,, bias B, e um coeficiente de aprendizado a, a variação 
dos ganhos é dado como: 


Wa = Wa + (Enya) (8) 
B, =B, +GE, (9) 
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Na finalidade de executar tais operações em sistemas embarcados, antes foi preciso 
a criação de uma biblioteca para lidar com as matrizes e os cálculos algébricos. Nela estão 
presentes as operações de: soma, subtração, multiplicação de Hadamard, multiplicação 
por escalar, transposta e um método para aplicação de uma função em cada valor da 
matriz, compondo as funções de ativação. O formato de alocação de ponteiros e estrutura 
foi selecionado como forma de construção da biblioteca, a fim de se garantir um computo 
rápido dos valores. 

Dispondo da biblioteca de matrizes, foram produzidas as rotinas de: feedfoward, 
cálculo de erros, backpropagation, importação e exportação dos ganhos. 

Partindo da premissa que, a rede neural será implementada como uma caixa preta 
para a identificação da planta e sintonização de um controlador, é desejável treiná-la 
para suportar a maior quantidade possível de modelos. Contudo, critérios de estabilidade 
devem ser mantidos, diante disso, limitar o espectro de funções fornecidas a rede deve ser 
considerado, assim como a qualidade dos controladores sintonizados para cada função, 
respectivamente. 

Sintetizando as asserções acima, foi desenvolvido um script na ferramenta 
computacional MATLAB para produzir o conjunto de dados de treinamento da rede neural. 
Partindo da equação de transferência da planta: 

1. Gera-se uma função de transferência variando todos os seus coeficientes 


aleatoriamente em +V,% dos valores da planta fornecida. V, é definido pelo 
usuário e dita o quão ampla será a região de atuação do controlador; 


Sintoniza-se automaticamente um controlador PIDf; 
Executa simulação do controlador gerado e equação no SIMULINK; 


Verifica-se estabilidade do controlador; 


a ron 


Armazena os valores de ação de controle, erro e saída, seguindo formato de 
leitura da rede neural; 


6. Repete o ciclo acima até que um número satisfatório de dados de plantas 
distintas possa ser coletado; 


7. No intuito de manter os cálculos executados pela rede com grandeza restrita, 
os dados do conjunto de treinamento são normalizados para valores entre zero 
e um; 


8. Por fim, os dados de: entradas, saídas esperadas e delimitadores das 
normalizações são armazenados em arquivos de texto. 

Considerando que o objetivo, para cada saída da rede é prever um valor, a métrica 
utilizada em seu treinamento deve ser relacionada ao erro. Logo, optou-se pela utilização 
do erro quadrático no backpropagation. Os critérios de estabilidade são garantidos através 
da verificação dos valores máximos e mínimos da simulação, além de um desvio padrão 
percentual dos valores de erro (referência - saída) da simulação. 
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Configuração do controlador 
O controlador PID implementado é discretizado utilizando o método de Tusting, 

onde: 
2z=1 
— Tiz+l 


(10) 


aplicando (10) em (1), tendo que N = temos: 


o Ega + Epe-jb + Ejk-2]€ + 8U(k-1] am Ufk-)d 
e 


(11) 


a = 4Kp + 4KaN + 2KiTa + 2Kp NTa + KINTÊ 
b = 2K;NT2 — 8K4N — 8K, 
c=4K, + 4K;N — 2KiT, — 2K,NTo + KNT2 
d=4-2NT, 
e=4+2NT, 


A equação (11) é traduzida e implementada na linguagem C / C ++. Visando futuras 
pesquisas e aplicações, uma biblioteca foi construída, na qual, a biblioteca de redes 
neurais fora incluída. Nesta biblioteca o controlador neuro-adaptativo é tratado como uma 
estrutura. Como principal atributo tem-se a rede neural. 


Kp |ki |Kd |Tf 


Figura 6: Controlador neuro-adaptativo. 


Fonte: autoria própria. 


Na Figura 6, configura-se a estrutura realimentada do: controlador, rede neural e 
planta. 
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IMPLEMENTAÇÃO DO CONTROLADOR DESENVOLVIDO 


O controlador neuro-adaptativo desenvolvido foi aplicado em uma bancada de 
suspensão magnética, cujo possibilita a realização de testes voltados a exploração das 
capacidades de adaptação na presença de não linearidades e constante mudança dos 
parâmetros da planta. 


Massa suspensa 


Fme 
f 


qme Px 
Imã 
| 
(o RR 


Il 
|| 
| 

| 
|| 
|| 
[Ut 


Núcleo de aço 


Figura 7: Suspensão magnética. 


Fonte: autoria própria. 


Modelo utilizado 


Caracterizado pela Figura 7, o diagrama de funcionamento pode ser dividido em 
dois principais componentes, um sistema massa-mola cujo recebe como entrada uma 
força magnética, e o sistema utilizado para induzir a força magnética, composto por uma 
bobina de fios de cobre. De acordo com a corrente fornecida a bobina, o módulo do campo 
eletromagnético gerado aumenta ou diminui, interagindo com os ímãs posicionados nas 
extremidades dos entreferros do circuito magnético, provocando uma alteração na posição 
do corpo suspenso. 

As equações características são dadas por (12) e (13): 


i2 


Eme = Ca (12) 


F=mi+Bx+kx (13) 
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A equação (12) descreve a força magnética gerada em um sistema MAGLEV (WONG, 
1986), onde C é uma constante característica da bobina, ia corrente e x a posição. Em (13) 
uma força resultante é expressa em função da posição, de forma que, os elementos ke B 
são as constantes elásticas e de atrito. Valores utilizados exibidos na Tabela 1. 


Parâmetro Valor Unidade 
N z 
c 2,775 — 
i 5 A 
X 0,005 m 
m 0,1427 kg 
s 
B 0,6943 N E 
k 150,1204 Nm 


Tabela 1: Coeficientes da planta. 


Fonte: autoria própria. 


O parâmetro “C”, normalmente obtido de forma experimental, foi encontrado da 
seguinte forma, equações retiradas de (SADIKU, 2012),R.,, BP, S, N, px, 4H, 4, são 
respectivamente: relutância magnética, densidade de fluxo magnético, fluxo magnético, 
área da seção transversal, número de espiras, posição do corpo a ser suspenso, espaço do 
entreferro, permeabilidade relativa do material e permeabilidade constante do ar, conforme: 


SB 
Fne =——[N] (14) 
qo) 
o campo magnético B é definido por: 


2» 
B=2I7] (15) 


e o fluxo magnético q: 
Ni 
da (16) 


m 


Assumindo que o sistema possui dois entreferros, aplicando (15) e (16) em (14), 
chega-se em (17): 
1 /Niy? 
Ene = al (17) 
Considerando o caminho médio p e a região de atuação x a relutância magnética 
do circuito é (18): 


substituindo (18) em (17), obtém-se (19): 
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2 N2yS i 
Fne=C—5= - p 
% 4 Af+x 
2H 


(19) 


A parcela expressa abaixo por (20) é desprezível para um núcleo de aço 1020. 


p = 
=2e77 =0 
ro (20) 


Manipulando as equações (19) e (20), definindo como (21): 


N2uosS [Nm? 
p= Ho | | 


4 [42 (21) 


Utilizando os valores da Tabela 2 é possível calcular C, apresentado na Tabela 1. 


Parâmetro Valor Unidade 

N 980 voltas 
H 

H, 3000 = 
H 

E, 4me” = 

Ss 0,0000950625 m? 

p 0,0012 m 


Tabela 2: Coeficientes do circuito magnético. 


Fonte: autoria própria. 


A parcela do comportamento de massa-mola é proveniente da interação entre os 
ímãs de polos opostos dispostos na região superior (levitada) e inferior (bobina e núcleo). 
Os coeficientes elásticos e foram obtidos de forma experimental. Encontrados a partir da 
análise do ensaio ao degrau, Figura 8. 


187 


Ensaio 
16 + ———-— Referência 


14 


md 
No 
T 


di 
o 
T 


Posição [mm] 


[o 02 04 06 08 1 12 14 16 18 
Tempo [s] 
Figura 8: Ensaio ao degrau. 
Fonte: autoria própria. 
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Para uma função de transferência de segunda ordem padrão com acréscimo de um 
grau de liberdade : 


Gs) = a. 
Ds? + ams + w2 (22) 
utilizando as equações de (OGATA, 2010), 
E- In M,| 
[mê In(M2) a 
r 
Un = 
e: (24) 


Os valores de sobressinal M, e tempo de pico [a são 3,4s e 0,15, respectivamente, 
de acordo com a Figura 8. A variável a é encontrada de maneira interativa, orientando-se 
com objetivo de igualar a frequência das senoides do modelo com o ensaio. 

Com os valores das equações (23), (24) derivados da análise do ensaio tem-se que: 


1052 


s2 + 4,8665 + 1052 (25) 


G1(s) = 


Linearizando (12) nos pontos e i através de Série de Taylor Bidimensional: 


9F 
Fa = F(Xi) + E 2 Xx-% 
o (26) 
ôF e 
R [ x=Xizi di E j 
-2 =2 «2 
j 2Ci . 2Ci i 
FD) =——i-—=-x+05 (27) 
x x X 
Separando a equação acima e transformando no domínio da frequência: 
G2=X (28) 
-2 
l 
W = (a (29) 
prosseguindo com os valores da Tabela 1: 
G2 = 0,005 (30) 
W = 0,000184 (31) 


De modo que, agrupando funções de transferência G1, G2e o ganho estático W, em 
malha aberta, o diagrama de blocos é reproduzido na Figura 9. 
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Figura 9: Planta em malha aberta. 


Fonte: autoria própria. 


Igualando a resposta ao degrau do modelo com a curva do ensaio, plotado na Figura 
10: 


Ensaio 
Modelado 
Referência 


Posição [m 


2 4 h 4 y 
0 0.5 1 1.5 2 


Tempo [s] 


Figura 10: Ensaio vs modelo. 


Fonte: autoria própria. 


Apesar do modelo calculado ser próximo ao real, a ferramenta IDENT do MATLAB foi 
usada para obter-se uma função de transferência ainda mais fidedigna. Com ajuste de de 
precisão, exposta na Figura 11. O ajuste da curva obtido resultou em uma função de ordem 
elevada, devido a tentativa de compensar a dificuldade de incorporar o comportamento 
não-linear. Logo, assume-se que o modelo obtido não é capaz de compreender todas as 
não-linearidades da planta. 
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Ensaio 
Estimado 
Referência 


NA as 
RIATIAS 


0 0.2 0.4 0.6 0.8 A dz 1.4 1.6 1.8 
Tempo [s] 


Figura 11: Ensaio vs estimativa IDENT. 


Fonte: autoria própria. 


Expostos na Tabela 3, os coeficientes gerados pelo MATLAB são posteriormente 
utilizados na equação (32). 


b, Valor a, Valor 
b, -14.85 a, 27.31 
b, 7718 a, 7465 
b, 4.176eº a, 1.412 €º 
b, 8.968 e” a, 1.423 €” 
b, 5.865 €º a, 1.591 6 
b, 1.289 e” a, 7.669 €º 
b, 2.836 €'! a: 2.902 €'º 
Tabela 3: Parâmetros função da transferência. 
Fonte: autoria própria. 
Função de transferência base utilizada para o treinamento: 
Es bos* + bys* + «+ bss + be 
Ds +ast+--+açs+as (32) 
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Treinamento da rede 


Dispondo de um modelo matemático próximo ao real, a rotina de geração de dados 
foi executada no MATLAB, resultando em 1,4 Gb de dados preparados para o treinamento 
da rede neural. A função de erro quadrático foi utilizada como métrica na avaliação do 
treinamento, pois o objetivo da rede é prever valores do tipo pontos flutuantes, assegurando 
que os coeficientes do controlador neuro-adaptativo estejam em sintonia com o estado 
atual da planta. Um total de 10 épocas com coeficiente de aprendizado de módulo 0,1 
foram usados no treinamento, exibido na Figura 12. Após testes, foi constatado que usando 
apenas uma camada oculta com cinco nós, a rede neural é capaz de realizar o aprendizado 
para esta aplicação. Topologia final da rede exibida na Figura 5. 


0.0124 p 


loss treino 
loss teste 


| 
0.0122 À 
0.012 | 

| 
0.018) N À 


0.0116 


Erro quadrático 


0.0114 | a 


0.0112 F E— 


0.011 5 . t Z 
1 
Época 


Figura 12: Curva de treino da RNA implementada. 


Fonte: autoria própria. 


Implementação no sistema embarcado 


A bancada de suspensão magnética funciona a partir do microcontrolador de 
tecnologia AVR Esp32 Dev Module, fabricado pela ESPRESSIF. Selecionado por ter 
qualidades como: ser um dispositivo de baixo custo, alta disponibilidade no mercado, 
pode ser programado através da plataforma Arduíno. A atuação da bobina do circuito 
magnético é feita através do chaveamento de um mosfet com um sinal PWM provindo do 
microcontrolador. A posição da peça levitada é obtida realizando a leitura do valor ADC de 
um sensor linear de efeito Hall. Como forma de maximizar o potencial de processamento 
do microcontrolador, não foram utilizadas interrupções por alarme, pois desta forma, 
o programa executa um ciclo após o outro, sem pausas. Firmware representado pelo 
fluxograma da Figura 13. 
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Início SETUP Início LOOP 
JJ 


Dispara timer T 


Inicia 
comunicação 
serial 


Declara as entradas 
e saídas 


tância 


Y Y 


Calcula ação de 


Configura PWM controle 


Envia as 
informações por 
comunicação serial 


Carrega RNA ao 
controlador 


Carrega 
delimitadaores da 
RNA ao controlador 


Atualiza referência 


Configura 
parâmetos da 
referência 


Aguarda timer 
T>=5ms 


Fim SETUP | 


Figura 13: Fluxograma do firmware. 


Fonte: autoria própria. 


Implementado a rede treinada com clock de 240MHz, foi constatado que o tempo 
para rede realizar a rotina do feedforward leva em média 550us. O cálculo da ação de 
controle em conjunto com a atualização de parâmetro é realizado em 570us. Apesar do 
sistema permitir uma frequência de 1,754kHz, a utilizada foi 0,2kHz, dado que a correlação 
entre tempo de pico do modelo T,, 100ms, e o tempo de amostragem do controlador, 5 ms, 
deve ser de 5 a 20 vezes mais rápida, segundo o autor (OGATA, 2010). 


RESULTADOS OBTIDOS 


A eficiência do controlador neuro-adaptativo proposto é comparada em relação a 
um controlador PID clássico, sintonizado pelo método Ziegler-Nichols. A Figura 14 expõe 
a comparação da resposta obtida dos controladores a um degrau de diferentes valores de 
módulo. É possível notar uma clara distinção entre o comportamento dos controladores, 
nos tempos 2s, 10s e 20 so PID clássico apresenta um valor de sobressinal elevado. Em 
adição de ter um tempo de estabilização mais lento que o do controlador neuro-adaptativo, 
observado nos tempos 3s, 16s e 225. 
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RNAPID 
PID 
Referência 


0 5 10 15 20 25 
Tempo [s] 


Figura 14: Comparação entre controladores. 
Fonte: autoria própria. 


Como forma de avaliar a adaptabilidade e robustez do controlador, foram realizados 
dois ensaios utilizando os mesmos controladores da comparação da Figura 14. No primeiro 
é acrescentando uma inclinação de 20º a bancada, já no segundo, uma massa de 22g é 
adicionada como forma de perturbação fixa. 


Es sa mam | 
Eli | Fotç | 
8 J F | Vol Rh] 
sm Ps PA | 
a ) 7 o dd 
ol 
[o] 5 10 15 20 
Tempo [s] 
Figura 15: Ensaio com elevação. Figura 16: Representação 3D da elevação. 
Fonte: autoria própria. Fonte: autoria própria. 


Na Figura 15 a dinâmica do circuito magnético e sistema massa-mola são alterados, 
uma vez que, a força peso não é mais normal a superfície de sua base. A temperatura do 
circuito magnético também deve ser levada em conta, uma vez que devido à alta corrente, 
o efeito Joule se intensifica, reduzindo a força máxima produzida pelo sistema. Na Figura 
15 nota-se que o controlador PID padrão apresenta oscilações e sobressinal do início ao 
fim. Já o controlador neuro-adaptativo proposto mantém uma atuação similar à do primeiro 
experimento. 
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RNAPID 
PID 
Referência 


Tempo [s] 


Figura 17: Ensaio com perturbação fixa. Figura 18: Representação 3D da perturbação fixa. 
Fonte: autoria própria. Fonte: autoria própria. 


No ensaio da Figura 17 o controlador PID clássico apresentou considerável 
sobressinal e pequenas oscilações nos tempos de 0,15, 10,1s e 20,1s. Características, 
que o controlador neuro-adaptativo implementado não exibiu, reforçando a sua capacidade 
adaptativa proposta. 


CONCLUSÕES 


Neste projeto é proposto a construção e implementação de um controlador neuro- 
adaptativo totalmente embarcado em um sistema microcontrolado em uma bancada com 
parâmetros de difícil estimação. Ambos os modelos apresentados nas Figuras 10 e 11 não 
conseguem representar todas as não linearidades da planta. 

O controlador PID com filtro derivativo de primeira ordem, sintonizado pela rede 
neural, foi capaz de manter uma robustez no sistema de malha fechada, diminuindo o 
sobressinal e reduzindo o valor de erro em para uma referência de degrau, em diferentes 
regiões de atuação. Somado aos resultados obtidos nos ensaios com inclinação de e 
acréscimo de um corpo maciço, tais características constatam a alta capacidade de 
adaptação do controlador neuro-adaptativo a mudanças nos parâmetros da planta, 
perturbações externas e não linearidades. 

Ressalta-se a Ótima performance obtida no computo das operações de sintonização 
dos parâmetros através da RNA e cálculo da ação de controle, com tempo de , realizadas de 
forma totalmente embarcada em um microcontrolador de baixo custo, e alta disponibilidade, 
tendo portabilidade a outros hardwares similares. O desenvolvimento e aplicação de uma 
biblioteca de redes neurais adaptativas voltada para microcontroladores foi o ponto chave 
para a obtenção dos resultados deste trabalho. 

Pesquisas futuras se mostram necessárias na comparação do controlador proposto 
com outros métodos de controle adaptativo, assim como implementações em outras 
aplicações práticas. 
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CAPÍTULO 5 


REDES BAYESIANAS PARA AUXILIAR NO 
DIAGNÓSTICO DA COVID-19 


Thiago Costa Brandão Toledo 


Edimilson Batista Dos Santos 


RESUMO: O surto da COVID-19 causada 
pelo coronavírus SARS-Cov2 foi uma 
preocu- pação global grave e urgente. 
Utilizar Redes Bayesianas para auxiliar 
no diagnóstico seria benéfico para tomar 
decisões rápidas sobre as necessidades 
de tratamento e iso- lamento, além de 
permitir determinar quais características 
apresentadas por casos suspeitos de 
infecção são os melhores preditores de 
um diagnóstico positivo. Nesse estudo, o 
objetivo foi aplicar diferentes algoritmos de 
aprendizado de Redes Bayesi- anas, sendo 
eles: K2, Tree augmented Naive Bayes 
(TAN) e Naive Bayes (NB). Os algoritmos 
foram treinados com um conjunto de 
dados disponibilizado no site Kag- gle 
com informações sobre a Covid-19. Os 
resultados obtidos pelos os classificadores 
Bayesianos (NB Categórico, TAN e k2) 
foram capazes de lidar com eficiência com 
a tarefa de classificação do atributo alvo 
COVID-19, apresentando um desempenho 
semelhante em termos de acurácia, 
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precisão e recall alcançando valores 
superiores a 97% em todas as medidas. 
Além disso demonstraram uma alta 
capacidade de identificar as variáveis mais 
relevantes pra um diagnóstico positivo. Por 
fim com base nos estudos foi evidenciado a 
eficácia das Redes Bayesianas para auxiliar 
no diagnóstico da COVID-19. 
PALAVRAS-CHAVES: Covid-19; K2; Naive 
Bayes; NB; Redes Bayesianas; SARS- 
Cov2; TAN; Tree Augmented Naive Bayes. 


BAYESIAN NETWORKS TO ASSIST 
IN DIAGNOSIS OF COVID-19 
ABSTRACT: The COVID-19 outbreak 
caused by the SARS-Cov2 coronavirus was 
a seri- ous and urgent global concern. Using 
Bayesian Networks to aid in diagnosis would 
be beneficial for making quick decisions 
about treatment and isolation needs, 
as well as allowing to determine which 
characteristics presented by suspected 
cases of infec- tion are the best predictors 
of a positive diagnosis. In this study, the 
objective was to apply different learning 
algorithms for Bayesian Networks, namely: 
K2, Tree aug- mented Naive Bayes (TAN) 
and Naive Bayes (NB). The algorithims 
were trained with a dataset available on 
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the Kaggle website with information about Covid-19. The results obtained by the Bayesian 
classifiers (Categorical NB, TAN and K2) were able to efficiently deal with the COVID-19 target 
attribute classification task, presenting a similar performance in terms of accuracy, precision 
and recall reaching values greater than 97 % on all measures. Furthermore demonstrated a 
high abil- ity to identify the most relevant variables for a positive diagnosis. Finally, based on 
the studies, the effectiveness of Bayesian networks to assist in the diagnosis of COVID-19 
was evidenced. 

KEYWORDS: Covid-19; K2; Naive Bayes; NB; Bayesian Networks; SARS-Cov2; TAN; Tree 
Augmented Naive Bayes. 


INTRODUÇÃO 


Desde o surgimento do novo coronavírus (SARS-CoV-2 ), responsável pela pande- 
mia de COVID-19 que causou a emergência, na China, em dezembro de 2019, a sociedade 
enfrenta uma grave crise de saúde global. O rápido surgimento de um grande número de 
novos casos em países asiáticos e a transferência para a Europa e outros continentes, levou 
a Organização Mundial da Saúde (OMS) a declarar uma emergência internacional de saúde 
pública em 30 de janeiro de 2020 e em 11 de março de 2020 uma pandemia(SANTOS, 
2021). De acordo com os dados disponíveis (WORLD HEALTH ORGANIZATION, 2023 b) 
até 21 de Março de 20283, houve 761.071.826 casos confirmados de COVID-19, relata- dos a 
Organização Mundial de Saude(OMS) ao redor do mundo, e o número de mortos ultrapassou 
a quantia de 6.879.676 

Os coronavírus são um grupo de vírus que foram inicialmente considerados como 
causadores de doenças respiratórias humanas inofensivas que não apresentavam risco 
de vida. No entanto, nos últimos anos, ocorreram casos de doenças respiratórias graves e 
fa- tais causadas por membros do subgênero beta-coronavírus (STRABELLI, 2020). Alguns 
exemplos incluem a síndrome respiratória aguda grave SARS, que surgiu na China em 2002 
e se espalhou rapidamente para outros países, de acordo com o documento técnico (WORLD 
HEALTH ORGANIZATION, 2003), “Um total cumulativo de 8.422 casos pro- váveis, com 
916 mortes, foram relatados”(WORLD HEALTH ORGANIZATION, 2008, p. 13); e a síndrome 
respiratória do Oriente Médio MERS, que foi identificada pela primeira vez na Arábia Saudita 
em 2012 e se espalhou para outros países do Oriente Médio e além, causando mais de 2.600 
casos e cerca de 900 mortes (WORLD HEALTH ORGANIZA- TION, 2023 a). Embora o surto 
de COVID-19, causado pelo coronavírus SARS-CoV-2, seja menos fatal do que o SARS e o 
MERS, sua alta transmissibilidade resultou em um número absoluto de mortes que excede 
as epidemias combinadas de SARS-CoV e MERS- CoV, tendo um impacto significativo na 
saúde pública, economia e sociedade em todo o mundo. 

Visto que a COVID-19 era ainda desconhecida em muitos aspectos, surgiram mui- tas 
dúvidas, no início, sobre a tomada de decisão pela equipe médica e governamental. Desta 
forma, muitos pesquisadores aplicaram técnicas de aprendizado de máquina para auxiliar no 
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estudo da COVID-19. Entre as diversas técnicas existentes, tem-se proposto o formalismo de 
Redes Bayesianas para auxiliar no diagnóstico da doença, entre outras aplicações (SANTOS, 
2021),(FENTON et al., 2020) e (TORRES et al., 2021). 

Uma Rede Bayesiana consiste em um modelo gráfico que caracteriza as dependên- 
cias e incertezas existentes em um domínio de estudo, através de um grafo que representam 
relações de probabilidade condicional, isto é, como a ocorrência de certas variáveis depende 
do estado de outra. 


OBJETIVOS 


Objetivos Gerais 

Este trabalho tem como objetivo principal avaliar se as Redes Bayesianas são 
modelos relevantes para o diagnóstico da covid e, desta forma, auxiliar os médicos no 
diagnóstico. Para isso, foram estudados e implementados três algoritmos de aprendizado de 
Redes Bayesianas: K2, Tree augmented Naive Bayes (TAN) e Naive Bayes (NB), os quais 
foram treinados com a base de dados “Symptoms and COVID Presence”, obtida a partir do 
repositório Kaggle. 


Objetivos específicos 


* Avaliar se a base de dados “Symptoms and COVID Presence” do repositório 
Kaggle está de fato adequada e realizar alterações, quando necessárias; 


* Analisar diferentes topologias de uma Rede Bayesiana, produzidas de acordo 
com as características dos algoritmos K2, TAN e Naive Bayes.; 


* Avaliar quantitativamente a previsão de Redes Bayesianas na base de dados 
por meio de medidas como acurácia; 


* | Encontrar quais variáveis são mais preditivas para o diagnóstico da COVID-19. 


Fundamentação teórica 


Este capítulo apresenta o conceito de Redes Bayesianas, bem como a definição de 
conteúdo relacionado, para a compreensão deste estudo. Além disso, são descritas revisões 
bibliográficas de trabalhos relacionados. 
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Redes Bayesianas 


As Redes Bayesianas consistem em um meio de caracterizar graficamente as de- 
pendências e incertezas existentes em um domínio de estudo “e utilizam o Teorema de 
Bayes como método quantitativo para a revisão dessas probabilidades, com base em uma 
nova informação amostral.”(SANTOS, 2007, p.6). Facilitando a identificação de “depen- 
dências entre variáveis (ou atributos) de uma base de dados, sendo úteis para tarefas de 
classificação.”(SANTOS, 2007, p.1) 

De acordo com Santos (2007), uma limitação muito comum em alguns algoritmos 
de aprendizado de Redes Bayesianas é a ordenação preexistente das variáveis utilizadas 
na definição do problema. Assim, a estrutura do grafo das Redes Bayesianas trespassa a 
depender da ordem das variáveis, o que faz com que a estrutura do grafo altere dependendo 
da ordem adotada. Isso pode ter “ uma importante função no processo de aprendizado das 
Redes Bayesianas auxiliando a reduzir o espaço de busca deste problema.” (SANTOS, 2011, 
p.1) 

Uma Rede Bayesiana é representada basicamente por dois componentes principais: 

1. Um grafo direcionado acíclico (DAG) G = (V, E) — é um grafo direcionado e 


sem ciclos, ou seja, suas arestas tem apenas uma direção tornando impossível 
percorrer todo o gráfico a partir de uma aresta. 


Onde V=([X, X, -.., X,) é o conjunto de nós e representa as variáveis 
aleatórias e E é o conjunto de pares ordenados de elementos distintos de V e 
representa as relações de dependências entre as n variáveis. Os elementos 
de E são chamados de arestas (ou arcos). Uma aresta direcionada do nó X, 
para o nó X, indica que X, é um dos pais de X, (SANTOS, 2011, p.5) 


2. “Uma tabela de probabilidade condicional (CPT) - que quantifica os efeitos que 

o conjunto de pais de X, tem sobre as variáveis X, em G. (SANTOS, 2011, p.5) 

No qual o valor de cada entrada na distribuição conjunta representa a probabilidade 

de uma conjunção de atribuições específicas, conforme descrito na fórmula extraída de 
(RUSSEL et al., 2003), p.608. 


n 


Pltisoçã AM (x;|pais(X,;)) 
RA (21) 

Onde P(x, ..., x,) representa a probabilidade conjunta de um conjunto de n variáveis 
aleatórias (x, ..., x,),e Il, P(xilpais(X;)) representa a decomposição dessa probabilidade 
conjunta em termos de probabilidades condicionais de cada variável aleatória em relação 
às suas variáveis pai. Desta forma, cada entrada na distribui- ção conjunta é representada 
pelo produto dos elementos apropriados da tabela de probabilidade condicional (CPT) na 


Rede Bayesiana. 
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Na Figura 1 extraída de (RUSSEL et al., 2003) é demonstrado um exemplo de Rede 
Bayesiana típica, mostrando a topologia e também as CTPs. Nas CTPs, as letras R, T,A, Je 
M representam Roubo, Terremoto, Alarme, JoãoLiga e MariaLiga, respectivamente. 


C Roubo > Terremoto > Ea 


Ci) 


t |070 
Fr looi 


Figura 1 — Representação de uma Rede Bayesiana. Fonte:(RUSSEL et al., 2003) 


Em Redes Bayesianas, a ausência de certos arcos (chamados de componentes qua- 
litativos) em um DAG indica a existência de relacionamentos condicionalmente indepen- 
dentes entre as variáveis, e sua presença pode representar a presença de dependências 
diretas. Tabelas de probabilidade (cnamadas de componentes quantitativos) são coleções 
de medidas de probabilidade condicional que demonstram a força das dependências, atu- 
alizadas usando o teorema de Bayes com base em novas informações de amostra. 

As Redes Bayesianas podem ser usadas para tarefas de aprendizado supervisiona- 
das e não supervisionadas. Ao executar tarefas de aprendizado supervisionado, as Redes 
Bayesianas são frequentemente chamadas de classificadores Bayesianos. 


Teorema de Bayes 


O teorema de Bayes é uma fórmula matemática probabilística proposta por Tho- 
mas Bayes (1702-1761) e publicada em 1763 por seu amigo Richard Price. Muito estudado 
e utilizado na área da estatística, este teorema permite o cálculo da probabilidade de um 
evento, dado que outro evento já ocorreu, o que é definido como probabilidade condicional. 

Para aplicar o teorema de Bayes, é necessário conhecer alguma informação poste- 
rior sobre um determinado evento de interesse e sua probabilidade. Isso permitirá conhecer 
a probabilidade da união de dois eventos, considerando eventos mutuamente exclusivos. 

A fórmula do teorema de Bayes para o cálculo de um evento (X), levando em conta 
que um evento (Y) ocorreu, é dada pela seguinte expressão: 
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Sendo: 
*— P(XIY): Probabilidade do evento X acontecer, dado que Y já ocorreu; 
*— P(YIX): Probabilidade de Y acontecer, dado que X já ocorreu; 
*— P(X): Probabilidade de X ocorrer; 
P(Y): Probabilidade de Y acontecer 


O exemplo 2.2 adaptado de ML ENGINEERING ([s.d.]) ilustra como o Teorema de 
Bayes pode ser usado para calcular a probabilidade de um evento de interesse a partir de 
probabilidades conhecidas. 

Exemplo 2.2. Suponha que Maria tenha feito um teste para COVID-19 e deseja saber 
a probabilidade de ter a doença. Sabemos que o teste não é completamente con- clusivo, 
e que a probabilidade de um positivos verdadeiro é P (TP) = P (pos IC) = 0.96, enquanto a 
probabilidade de um falso positivo é P (FP) = (pos IC) = 0.04. Além disso, conhecemos que a 
probabilidade de alguém ter COVID-19 é P (C) = 0.015 (117 milhões de casos, 7.9B pessoas) 
com base em dados estatísticos globais. 

Aplicando o teorema de Bayes, podemos calcular a probabilidade de Maria ter 
COVID-19, dado que o teste dela deu positivo. A equação é: 


P(pos|C) + P(C) P(pos|C) * P(C) 


do adia P(pos) — Plpos|C)P(C) + P(poslnotC)(1 — P(C)) 


Em que: 


e P(Clpos)é a probabilidade de Maria ter COVID-19, dado que o teste 
dela deu positivo; 


e P(poslC) é a probabilidade de um resultado positivo verdadeiro; 
e P(C)éa probabilidade de alguém ter COVID-19; 
e P(posinotC) é a probabilidade de um resultado falso positivo; 
* 1-P(C)éa probabilidade de alguém não ter COVID-19; 
e P(pos) é a probabilidade de um resultado positivo. 
Substituindo os valores conhecidos na equação, temos: 


0.96 + 0.015 
— 0.960.015 +40.04(1 — 0.015) 


P(Clpos) = (0.268 


Isso significa que a probabilidade de Maria ter COVID-19, dado que o teste dela deu 
positivo, é de apenas 0,268. Essa probabilidade é menor do que muitas pessoas esperam, o 
que destaca a importância de levar em consideração as limitações dos testes e a prevalência 
da doença ao interpretar os resultados do teste. 
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Classificadores Bayesianos 


Naive Bayes 


O algoritmo Naive Bayes (NB), ou classificador Bayesiano, é um classificador pro- 
babilístico muito utilizado em Aprendizado de Máquina, que foi baseado no “Teorema de 
Bayes”. 

É um modelo que sucede a árvore de decisão. Ele parte da premissa de que cada 
variável é independente das demais, de acordo com a base de dados. Ou seja, ele descon- 
sidera a correlação entre as variáveis, como por exemplo se uma fruta é classificada como 
Melão por ser amarela e oval, o NB não leva em consideração a correlação entre esses 
aspectos. Sendo esse o motivo por ser conhecido como “Naive” (ingênuo). 

Algumas vantagens do NB são as seguintes: 

* Eficiência computacional: o tempo de treinamento é linearmente relacionado ao 
nú- mero de amostras e atributos de treinamento, o tempo de classificação é 


linearmente relacionado ao número de atributos e não é afetado pelo número 
de amostras de trei- namento. 


* Baixa variância: Como o NB não usa pesquisa, ele tem baixa variância, e apre- 
senta um alto viés. 


* Aprendizagem incremental: NB opera em estimativas de probabilidade de baixa 
ordem derivadas dos dados de treinamento. Estes podem ser facilmente atuali- 
zados quando novos dados de treinamento são obtidos. 


* | Previsão direta de probabilidades posteriores. 


A função do NB baseado no Teorema de Bayes para se prever o valor do atributo 
classe C em função das demais n variáveis, é calculada pela seguinte equação: 


P(Clzi, ....,2n) = «P(C) IN P(uilC) 
i=1 (2.3) 


Em que P(C) é a distribuição a priori do atributo classe e «= P(Clx,..., X,) 

é constante para todas as classes. Sendo o valor do atributo C o que produzir a maior 
probabilidade na Equação 2.3 que será selecionado como a classe prevista. 

Na Figura 2 extraída de (SANTOS, 2007, p.29) representa um exemplo da rede de um 
NB, onde todos os atributos 4, ...., 4, são considerados independentes condicio- nalmente 
um do outro, dado o valor do atributo classe C. 
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=” qa : y A. 


(Ay RA: As) ... 2) 
Y E cá 


Figura 2 — Estrutura da rede de um classificador Naive Bayes. Fonte: (SANTOS, 2007) 


Naive Bayes Categórico 


No algoritmo Naive Bayes temos diferentes classificadores que diferem principal- 
mente pelas suposições que fazem em relação à distribuição de P (IC). 

Nesse estudo foi utilizado o Naive bayes Categórico, sua fórmula é a seguinte como 
podemos ver na equação (2.4): 


o Nec + a 


P(x; = tly =cC a) =— N Agi 


(2.4) 

Onde Mic —-ticeJry;-ty=-Héa categoria de numero de vezes que taparece 
nas amostras x, que pertencem á classe c, Ne = Hj e J|y; = ck é o números de amostras 
com a classe c ,a é um parâmetro de suavização e n, é o número de categorias dos recursos 
disponíveis i. 

Após uma coleta de dados, é realizado o cálculo com base nessa fórmula, para se 
obter o resultado final. Esse algoritmo é muito usado para processamento de linguagem 
natural e diagnósticos médicos, graças a sua análise probabilista condicional. 


K2 


O K2 é um algoritmo de busca heurística desenvolvido para a indução de estruturas de 
Redes Bayesianas, apresentado por Cooper e Herskovitz (COOPER; HERSKOVITS, 1991). 
“Muito conhecido devido ao seu desempenho em termos de complexidade com- putacional 
(tempo) e resultados precisos, obtidos quando uma ordenação de variáveis adequada é 
fornecida “ (SANTOS, 2011, p.14). 

Esse modelo parte de um grafo sem arestas e utilizando uma busca gulosa para 
encontrar a melhor estrutura a cada iteração escolhe uma nova aresta que será inserida 
na rede. Segundo Santos (2011) o algoritmo se inicia primeiramente, assumindo que todos 
nós não têm pai. Então, a partir do segundo atributo da lista ordenada (sendo o primeiro o 
nó raiz), os possíveis pais são testados e o nó que maximiza a probabilidade de a estrutura 
concordar com o banco de dados é adicionado à rede. Repita esse processo para todos os 
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atributos até encontrar a melhor estrutura possível da Rede Bayesiana. 


A suposição dos atributos pré-ordenados é usada para reduzir o número de 
possíveis estruturas a serem aprendidas. K2 usa uma lista ordenada (contendo 
todos os atributos) que afirma que apenas os atributos posi- cionados antes 
de um dado atributo xi podem ser pais de xi. Assim, o primeiro atributo na lista 
não tem pais, ou seja, é um nó raiz na Rede Bayesiana. (SANTOS, 2011, p.14) 


Essa ordenação das variáveis requer conhecimento prévio sobre os dados, sendo 
esta a principal desvantagem do algoritmo K2. 
Para cada atributo, a métrica (pontuação) que K2 usa para testar cada conjunto de 
possíveis pais do nó é dada por g(i, 7) : (extraída de (SANTOS, 2011, p.14)) 
; E r;— 1)! da 
No qual cada atributo x (i=1,...n) possui r, valores possíveis (V,, ..., V, 


iri 


). O 
atributo x, possui um conjunto de nós pais 7,, onde q, é o número de instanciações 
der, N, 
e 7, é instanciado como Wo denotando a j — ésima instanciação de 7, em relação a D. Por 
fim, Ni; = D Ni. 


x é o número de objetos no conjunto de dados D, onde x, tem o valor v, 


Tree Augmented Naive Bayes 


O Tree Augmented Naive Bayes (TAN) é um classificador Bayesiano que tem como 
objetivo atingir melhores classificadores que o NB, foi proposto por Friedman e Goldszmidt. Em 
comparação com o Naive Bayes, o TAN pode produzir modelos mais precisos, especialmente 
em conjuntos de dados com alta dependência entre os atributos, no entanto, a construção do 
modelo TAN é mais complexa e computacionalmente mais exigente do que o Naive Bayes. 

O classificador TAN diminui a restrição imposta na construção da estrutura do NB e 
permite dependências entre outros atributos além do atributo classe C, ou seja, existem (n-1) 
atributos que dependem condicionalmente de outro atributo além da dependência da classe 
C. Os arcos adicionais entre os atributos são encontrados através de um algoritmo de busca, 
o que significa que não há uma restrição prévia na construção da estrutura do modelo. Dessa 
forma, é possível identificar dependências entre os atributos que podem melhorar a precisão 
do modelo, uma vez que nem todos os atributos são independentes entre si. 

A Figura 3 extraída de (SANTOS, 2007, p.30), representa um exemplo da rede de um 
modelo TAN. 
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Y RÁ 


Figura 3 — Estrutura da rede de um classificador TAN. Fonte: (SANTOS, 2007) 


O fato de haver, no máximo, mais um pai adicional para cada atributo significa 
que pode haver um arco no grafo da variável A para A . Isso implica que esses 
dois atributos, 4 e 4, não são independentes, dado a classe. A influência de 
A nas probabilidades da classe depende também do valor de A.(SANTOS, 
2007, p.30) 


A probabilidade a posteriori do modelo TAN é representada pela Equação 2.6 : 


P(Cher, tn) = P(C)-P(X,IC) TT PleilC;, Xporente) 
i=1 (2.6) 

A equação representa a probabilidade a posteriori da classe C, dado um conjunto de 
valores de atributos x,, ..., x,. Essa probabilidade é calculada multiplicando a distribuição a 
priori da classe C(P (C)) pela probabilidade de ocorrência do nó raiz da árvore onde a classe 
ocorre (P (X1C)) e pelas probabilidades condicionais de cada atributo dado sua classe e seu 


pai na árvore (P (x IC, X 


parente) )- Essas probabilidades condicionais são calculadas a partir dos 


dados de treinamento, utilizando a técnica de máxima verossimi- lhança. 
Portanto, a equação da probabilidade a posteriori é uma das principais equações 
utilizadas no modelo TAN para classificar novos exemplos com base em seus atributos. 


Trabalhos relacionados 


Um estudo aplicado no estado de São Paulo utilizando Redes Bayesia- nas na 
predição do controle no avanço de COVID-19. 


A dissertação de Felipe Alexandre Santos (SANTOS, 2021) apresenta um estudo 
aplicado no estado de São Paulo que utiliza Redes Bayesianas na predição do controle no 
avanço da COVID-19. O objetivo do estudo é modelar as decisões tomadas pelo PlanoSP, 
medida criada pelo estado de São Paulo, que permite a cada região reabrir determinados 
setores de acordo com a fase em que se encontra, determinada pela relação entre a 
capa- cidade do sistema de saúde e a evolução da pandemia. Além disso, a dissertação 
utiliza inferência de Bayes para analisar fatores de risco relacionados a casos médicos de 
contágio e óbitos por COVID-19. 
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Para o estudo, foram utilizadas duas bases de dados intituladas como DataSet 1 e 
DataSet 2; e proposto uma modelagem estrutural de sua Rede Bayesiana, após a extração 
os dados foram tratados, ordenados e formatados para o processamento da Rede. 

A modelagem estrutural da Rede Bayesiana proposta foi elaborada objetivando 
predizer a classificação que uma região receberá pelo PlanoSP com base nos balanços já 
publicados no DataSet 1, e para o DataSet 2, foi utilizada a divisão em determinados grupos 
para a implementação e desenvolvimento da Rede Bayesiana, levando em consi- deração 
variáveis de entrada em razão da categoria epidemiológica, clínica e demográfica, bem como 
as categorias numéricas da pandemia no estado de São Paulo. 

Nas Figuras 4 e 5 abaixo é apresentado as estruturas Bayesianas propostas para O 
dataset1 e 2 respectivamente. 

Após o tratamento dos dados, as duas bases foram treinadas utilizando dois algo- 
ritmos diferentes: expectation-maximization (EM) e Gradient. 

Nos testes realizados para o DataSet 1, foi observada uma diferença nas proba- 
bilidades à priori encontradas por cada algoritmo de treinamento. Visando uma melhor 
suavização dos dados de inter classificação, foi constatado que o melhor método para o 
treinamento deste DataSet seria o Gradient Decrescente. 


Ocupação Leitos ? = COVID por 100 Novos casos por 100 | Novias internações Novos óbitos por 100 
coviD mil hab. mil hab. por 100 mil hab. mil hab. 
Capacidade Evolução da 
Hospitalar Pandemia 
Tr Classificação + 
cmo > classificação Filtrada 


Figura 4 — Estrutura da rede Proposta para o DataSet 1. Fonte: SANTOS, 2021 
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Figura 5 — Estrutura da rede Proposta para o DataSet 2. Fonte: SANTOS, 2021 


Com o uso do algoritmo Gradient para o treinamento da Rede Bayesiana, foi realizada 
uma comparação com os dados do vigésimo balanço, cujos valores não estavam presentes 
no DataSet, e o algoritmo demonstrou alta eficácia em inferir as fases. 

Na segunda Rede Bayesiana, cujos dados para treinamento foram utilizados 
do DataSet 2, com a inferência da Rede Bayesiana montada, foi possível concluir que o 
paciente com maior índice de morte seriam aqueles que apresentam idade maior que 80 
anos, portadores de asma, obesos e diabéticos. 

Os resultados obtidos indicam que o modelo preditivo desenvolvido apresenta 
alta eficácia em inferir as fases do PlanoSP e em identificar fatores de risco associados à 
COVID-19. Os autores ressaltam que sistemas como esse podem ser utilizados no auxílio da 
tomada de decisão pelos órgãos públicos e contribuir para a contenção da pandemia. 

O trabalho é relevante para a área de aprendizado de máquina aplicada à saúde 
pública, e apresenta uma metodologia clara e objetiva para o desenvolvimento de modelos 
preditivos baseados em Redes Bayesianas. 


Uso de Redes Bayesianas para apoiar a tomada de decisão sobre a propagação 
do COVID-19 


No artigo de Freddy E. Torres Cordeiro, Neilys González Benítez e Omar Mar Cornelio 
(TORRES et al., 2021), o principal foco é um estudo da utilização de Redes Bayesianas 
como ferramenta de modelagem para apoiar a tomada de decisão sobre a propagação do 
COVID-19. Já que Redes Bayesianas têm a capacidade de armazenar e tratar grandes 
volumes de informações compostas por diversos tipos de dados; os quais nem sempre 
são tão precisos e completos quanto necessário. Ao contrário dos modelos matemáticos 
utilizados no âmbito epidemiológico, que têm características variáveis e não são suficientes 


para apoiar a tomada de decisão sobre a disseminação da COVID. 
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A estrutura proposta pelo autores para o uso das Redes Bayesianas foi composta por 
três componentes: 
* | Gestão do conhecimento que descreve os elementos fundamentais a conta se- 


rem incluídos nos sistemas de informação e vigilância para a propagação da 
covid. 


* Análise inteligente dos dados onde os dados de entradas das fontes utilizadas 
foram pré processados para remover dados que prejudiquem o resultado, a fim 
de garantir sua disponibilidade, completude e fidelidade. 


* | Rede Bayesiana como ferramenta probabilística de apoio a tomada de decisão 
so- bre a disseminação da COVID construída em três fases: definição do grá- 
fico, identificação de modelos canônicos e obtenção dos dados quantitativos. 

Os resultados demonstram que a utilização de Redes Bayesianas melhora a qua- 
lidade dos processos médicos-assistenciais na previsão e classificação de doenças. Além 
disso, o grafo da Rede Bayesiana proposta minimiza a imperfeição dos dados presentes, 
contribuindo para um diagnóstico mais preciso de sintomas, sinais e presença da COVID-19. 
Na figura 6 é representado o grafo para apoiar a tomada de decisão sobre a propagação do 
Covid-19. 

A Figura 6 evidência que os sintomas mais relevantes da doença são: Febre e falta 
de ar, sendo que a direção dos arcos representa uma direção diagnóstica. A informação 
numérica é introduzida na Rede Bayesiana por meio da tabela de probabilidade condici- onal 
de cada nó. O restante dos sintomas são típicos de doenças respiratórias, mas se não houver 
falta de ar, os pacientes podem estar com gripe. Olhos irritados podem indicar alergias, assim 
como espirros e coriza. 

p(alergia/ojos, irritados)=0.95 


p(alergia"ojos, iritados)=0.05 
ALERGIA 
a 
/ 
OJOS IRRITADOS / p(resfriado/alergia)=0.67 
/ plresfriado”alergia)=0.33 
“ 


pígoteo nasal/gripe)=0.87 RESFRIADO 
pígoteo nasal/gripe)=0.13 GRIPE 
a N Ed 
GOTEO, NASAL N rá 
e N / plfiebreiresfriado, gripe)=0.98 
AND / p(fiebre/resfriado, “gripe)=0.1 
o Fá p(fiebre"resfriado, gripe)=0.17 
p(fiebrefresfriado, “gripe)=0.003 
FALTA DE AIRE FIEBRE 
> º pícovid-19/faita de aire, fiebre)=0.98 
COVID-19 p(covid-19/ falta de aire, fiebre)=0.9 


p(covid-19/falta de aire, “fiebre)=0.87 
p(covid-19/falta de aire, “fiebre)=0.01 


Figura 6 — Grafo para apoiar a tomada de decisão sobre a propagação do Covid-19. Fonte: TORRES et 
al., 2021 
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Portanto a utilização de Redes Bayesianas impacta positivamente na certeza do 
diagnóstico da covid-19, pela sua capacidade de trabalhar com dados discretos e contí- nuos 
simultaneamente, a variedade de problemas que podem resolver e a flexibilidade na estrutura 
do modelo.A utilização dessas ferramentas pode contribuir para uma tomada de decisão mais 
assertiva e auxiliar na previsão e classificação da doença, o que pode ser importante para a 
elaboração de estratégias de combate à pandemia. 


Um modelo de Rede Bayesiana para avaliação personalizada de risco COVID-19 
e rastreamento de contatos 


O artigo (FENTON et al., 2021) apresenta um instrumento de rastreamento para o 
COVID 19. Para a construção desse instrumento, anteriormente foi feito um levantamento 
bibliográfico cujo objetivo era saber o que a literatura tinha sobre essa temática. Um dos 
artigos encontrados demonstrou que para sucesso na aplicação e prática de determinado 
instrumento, era necessário que 90% a 95% da população tivesse acesso a smartphones, 
entretanto, 40% da população está com faixa etária acima de 65 anos, o que limita um pouco 
a utilização de tais ferramentas. Através dessas informações, conclui-se que o ins- trumento 
denominado aplicativo de rastreamento de contatos não é a melhor estratégia para contenção 
de uma pandemia. 

Outro estudo propôs um aplicativo também, desenvolvido no Reino Unido (NHSX), em 
que, através da tela do seu celular, era mostrado quando um indivíduo estivesse pró- ximo a 
alguém contaminado. Entretanto, só é mostrado no celular tempos depois, quando a doença 
já se transmitiu a várias outras pessoas. 

O atual artigo, a partir dos estudos analisados, propôs um instrumento de cará- 
ter dissertativo, ou seja, o usuário fornecia as informações através de um questionário e 
tais informações eram inseridas em uma plataforma, a fim de diminuir a possibilidade 
de comprometer a privacidade do usuário, os dados armazenados centralmente são a 
probabilidade do usuário ter covid-19 e a localização do gps.É importante destacar que o 
modelo apresentado é um BN causal, ou seja, sua estrutura é definida pelo conhecimento 
básico de causalidade, e não apenas a partir de dados. 

Sendo assim, o modelo Bayesiano busca calcular a probabilidade de uma pessoa 
contrair o “COVID 19”de forma assintomática, nos estágios leve ou grave. O modelo foi 
integrado em um aplicativo para smartphones, e além de calcular a probabilidade de um 
indivíduo contrair a doença, oferece também informações estatísticas sobre regiões cuja 
propensão é grande para novos surtos. 

O modelo virtual consiste em nós e arcos, os nós correspondem a variáveis que podem 
ou não ser observáveis, além de serem caracterizados como discretos ou contí- nuos. A partir 
de tais variáveis, surgem valores que sugerem determinada probabilidade, dependendo do 
tipo e estado do nó na tela. 
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Por sua vez, surgirá um arco entre nós caso as variáveis correspondam de forma 
considerável, estatisticamente falando. 

A partir disso, é mostrada uma tabela de probabilidade, vale ressaltar que tal 
probabilidade será baseada nas informações pré-estabelecidas. 

Em síntese, um indivíduo só poderá ser infectado se tiver entrado em contato com o 
vírus. A quantidade de vírus contraída determinará a probabilidade de infecção real. 

Qualquer instrumento ou ferramenta cujo objetivo é estimar determinada circuns- 
tância oferece limitação em sua prática e determinada margem de erros. 

Entretanto, diferente dos outros aplicativos já desenvolvidos, o presente modelo 
combina diversas informações inseridas pelo próprio indivíduo, o que garante maior as- 
sertividade contanto que a informação seja inserida de forma honesta. Além de fornecer 
informações específicas em relação a probabilidade de surtos e de nível de infecção, bem 
como leve ou grave. 

Em suma,a proposta dos autores apresentada no artigo, baseada na coleta centra- 
lizada de apenas três dados: a probabilidade de o usuário ter COVID-19, a localização do GPS 
e um identificador exclusivo. O modelo BN proposto diferencia-se de outras so- luções, pois 
combina informações retrospectivas com rastreamento de sintomas e fornece probabilidades 
personalizadas do status passado, atual e futuro da COVID-19. 

Além disso, o modelo preserva a privacidade, pois as informações pessoais não são 
compartilhadas e apenas o status atual de probabilidade do COVID-19 e a localização do 
GPS precisam ser compartilhados. O estudo sugere que soluções como essa podem ter um 
efeito benéfico na contenção da propagação da pandemia e na redução da necessidade de 
bloqueios draconianos, combinadas com uma estratégia de comunicação eficaz. 


METODOLOGIA 


Este capítulo tem como objetivo descrever a base de dados empregada no estudo 
e sua análise, bem como descrever a aplicação dos modelos de Redes Bayesianas imple- 
mentados. 


Base de Dados 


Para o desenvolvimento deste estudo foi utilizado uma base de dados importada do 
Kaggle denominada “Symptoms and COVID Presence *. O conjunto contém 5434 da- dos, 
sendo 4383 casos positivos e 1051 negativos. Ela é composta por 21 atributos, sendo eles: 
Breathing Problem (Problema Respiratório); Fever (Febre); Dry Cough (Tosse seca); Sore 
throat (Dor de Garganta); Running Nose (Coriza); Asthma (Asma); Chronic Lung Disease 
(Doença Pulmonar Crônica); Headache (Dor de Cabeça): Heart Disease (Doença Cardíaca); 
Diabetes; Hyper Tension (Hipertensão); Fatigue (Fadiga); Gastrointestinal; Abroad travel 
(Viagens); Contact with COVID Patient (Contato com Paciente COVID); Attended Large 
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Gathering (Participou de grandes encontros); Visited Public Exposed Pla- ces (Visitou 
Público Locais Expostos); Family working in Public Exposed Places (Família trabalhando em 
Locais Públicos Expostos); Wearing Masks (Uso de Máscaras); Sanitiza- tion from Market 
(Higienização do Mercado); COVID-19 (positivo ou negativo). 

A base foi tratada na linguagem Python com o auxílio das bibliotecas Pandas 
e Dataprep. Foi verificado que não há valores ausentes na base, sendo assim ela nos 
oferece mais confiança, precisão, eficiência e insights nas análises e tomadas de decisões. 
Também foi verificado os valores mais frequentes do atributo alvo (COVID-19) indicando uma 
frequência muito maior de casos positivos (4383 contra 1051) representando 80,7% da base. 
Com o desbalanceamento da base evidenciado foi feita uma base balanceada que pode 
evitar possíveis viéses e garantir uma análise mais equilibrada e precisa dos dados. 

Também foi analisado a correlação dos atributos onde foi possível perceber que os 
atributos Wearing Masks (Uso de Máscaras) e Sanitization from Market (Higienização do 
Mercado) tem ausência de variação com o mesmo valor (Falso/No) para todos os dados, 
dessa forma eles não fornecem informações úteis para a previsão do atributo alvo, portanto, 
eles podem ser descartados da base de dados sem afetar negativamente a precisão ou 
qualidade da análise preditiva. Além de constatar que os atributos Fever (Febre), Dry Cough 
(Tosse seca) e Sore throat (Dor de Garganta) juntamente com Breathing Problem (Problema 
Respiratório) foram os atributos que tiveram maior correlação com o atributo alvo. Os atributos 
Abroad travel (Viagens), Attended Large Gathering (Participou de grandes encontros) e 
Contact with COVID Patient (Contato com Paciente COVID) tiveram uma interferência 
secundária na predição. 

Para facilitar a análise e aprendizagem da base de dados pelos algoritmos im- 
plementados a base foi convertida para valores booleanos False e True, definidos como os 
valores numéricos O e 1, respectivamente, uma vez que, originalmente, os atributos possuíam 
valoração “Yes'/No”. 

Para os três modelos (NB Categórico, TAN e K2) foi utilizado a função train test split 
para separar a base em um conjunto de teste e treinamento. Os testes foram feitos utilizando 
20% (1087 - base desbalanceada e 421 - balanceada) das instâncias do banco de dados e o 
restante dos dados foram para treinamento. 


Base de Dados balanceada 


No tratamento da base foi verificado seu desbalanceamento no atributo alvo (COV- 
ID-19) com uma frequência muito maior de casos positivos (4383 contra 1051). A fim de 
trazer um equilíbrio nas escolhas aleatórias do teste, evitando um viés de classificação sem 
uma classe majoritária de casos positivos, que poderia tornar o algoritmo tendencioso para 
a mesma, foi feito uma base balanceada. Além de evitar um viés de classificação uma base 
balanceada pode melhorar a precisão e reduzir o sobreajuste. 
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A base de dados foi balanceada retirando instâncias positivas, agora conta com a 
mesma quantidade de casos positivos e negativos, 1051 para cada classe. 

A correlação dos atributos dessa nova base de dados não difere muito da base des- 
balanceada em relação aos atributos mais significativos, porém a correlação dos atributos 
com atributo alvo aumentou consideravelmente. 


Aplicação dos modelos de Redes Bayesianas 


Os algoritmos foram implementados para os modelos definidos na fundamentação 
teórica Naive Bayes, K2 e TAN utilizando a linguagem Python e os recursos disponíveis na 
mesma. 

Para os três modelos sua precisão foi calculada usando o método score() que quan- 
tifica a frequência com que a classificação foi realizada corretamente e o método classifi- 
cation report que gera um relatório mostrando as principais métricas de classificação. 

Segue uma breve descrição de cada classificador: 

* 'Naive Bayes foi implementado com auxílio da biblioteca Scikit-learn. Primeira- 
mente foi feito a separação da base de dados em atributos preditores (x) e o 
atributo alvo (y), que é a coluna “COVID-19”. 

O modelo então é treinado usando o método CategoricalNB() e fit(). Em seguida é 
usado para fazer previsões usando o método predici(). 

Para identificar as características (atributos preditores) mais relevantes para a pre- 
dição de um diagnóstico positivo, é utilizado o método SelectKBest usando a função chi- 
quadrado como função para avaliar a relevância das características. A função de pontuação 
do chi-quadrado é uma medida estatística que mede a dependência entre duas variáveis 
categóricas. Nesse contexto, ela é usada para determinar a relação entre cada atributo 
individual e a variável alvo. 

* Tree Augmented Naive Bayes foi implementado com auxílio das bibliotecas 
Scikit-learn e PGMPY. 

O grafo da rede TAN foi construído a partir dos dados carregados utilizando as classes 
TreeSearch e BayesianEstimator a partir delas foram feitas as seguintes funções: est = 
TreeSearch (df train, root node = 'Breathing Problem” e dag = est.estimate (estimator type 
= 'tan) class node = 'COVID-19', o parâmetro root node é o nó raiz da estrutura do grafo, 
enquanto o class node é o nó alvo que você deseja prever, já estimator type = 'tan' define 
algoritmo a ser usado para estimar o DAG. 

Então a Rede Bayesiana é construída a partir da estrutura do grafo usando as funções 
disponíveis nas classes BayesianNetwork e BayesianEstimator. 

Para identificar as características (atributos preditores) mais relevantes para a predi- 
ção de um diagnóstico positivo, foi utilizado o método classifier.feature importances. . 
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* | K2 O algoritmo foi implementado com a ajuda das bibliotecas Scikit-leam e 
numpy, fundamentos teóricos e os pseudocódigos disponíveis em (SANTOS, 
2007, p.16) e (SANTOS, 2011, p.15). 

As variáveis de entrada e saída são definidas sendo symptoms contém os nomes 
dos atributos relacionados com a COVID-19 considerados como entradas do modelo, e 
target é o nome da variável de saída, que é 'COVID-19”. A estrutura da Rede Bayesiana é 
definida como um dicionário chamado network. Cada atributo em symptoms é associado a 
uma lista vazia de pais, e target é associado à lista de todos os atributos presentes em 
symptoms. Dessa forma a estrutura da Rede Bayesiana indica que o target (COVID-19) é 
diretamente dependente de todos os atributos. 

O algoritmo K2 responsável por determinar os pais específicos para cada atributo 
com base na maximização do escore de pontuação é então implementado para apren- der 
a estrutura da Rede Bayesiana. Para cada nó (atributo) em symptoms, são encontrados os 
melhores pais para o nó, com base na pontuação de uma métrica de qualidade (score). Os 
pais são selecionados iterativamente, considerando até três sintomas anteriores. O melhor 
pai para cada nó é adicionado ao network. 

A função predict realiza previsões recebe uma instância de teste e o network. A 
função calcula as probabilidades dos nós no network com base nos seus pais. Se um nó não 
tiver pais, a probabilidade é calculada com base na média do valor desse nó nos dados de 
treinamento. E retornado um dicionário de probabilidades. 

Esta função também realiza as previsões para os casos de teste. Ela é usada para 
obter as probabilidades dos nós no network, e uma previsão binária é feita com base na 
probabilidade do nó target. As previsões são armazenadas na lista predictions. 

A identificação das características mais relevantes é feita usando o método mu- tual 
info classif. 


RESULTADOS 


A aplicação dos classificadores TAN e K2 sobre a base de dados utilizada no estudo, 
produziu as representações gráficas, apresentadas nas Figuras 7 e 8, respectivamente. 

É importante salientar que o Naive Bayes categórico não gera um grafo explícito 
como em outras abordagens, pois nesse classificador, cada variável é tratada de forma 
independente, e a probabilidade condicional de cada variável dado o valor do rótulo é 
calculada. 
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Figura 7 — Estrutura da rede TAN gerada sobre a base de dados. Fonte: Autor 
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Figura 8 — Estrutura da rede K2 gerada sobre a base de dados. Fonte: Autor 


Nas Figuras 7 e 8, é possível observar as relações de dependência condicional entre 
as variáveis, representadas pelas arestas nas redes geradas. 

A direção das arestas indica a direção da dependência condicional entre os atribu- tos. 
Por exemplo, se uma aresta aponta do atributo A para o atributo B, significa que o atributo B 
depende condicionalmente do atributo A. Isso implica que o valor do atributo B é influenciado 
pelo valor do atributo A. 

Portanto, ao analisar as direções das arestas nas Figuras 7 e 8, podemos identi- 
ficar quais atributos afetam diretamente outros atributos e compreender as relações de 
dependência entre eles. 
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Na Figura 7, na rede gerada pelo classificador TAN, é notável que todos os atribu- tos 
estão dependentes do alvo “COVID-19”. Além disso, podemos observar as dependências 
entre alguns atributos, como a ligação entre “Visited Public Exposed Places” (Visitou Pú- blico 
Locais Expostos) e “Contact with COVID Patient” (Contato com Paciente COVID). 

Na Figura 8, gerada pelo K2 como mencionado anteriormente, o atributo “COVID- 
19foi associado a uma lista contendo todos os atributos, o que indica sua dependência com 
todos eles. Também foi observado que todos os atributos são dependentes do atri- buto 
“Breathing Problem” (Problema Respiratório). Isso ocorre devido ao fato de o K2 considerar a 
ordem dos atributos, sendo o atributo mencionado o primeiro nessa ordem. 

A Tabela 1 expõe o relatório de classificação das medidas de acurácia, precisão e 
recall(sensibilidade) encontrados para cada classificador Bayesiano. Primeiramente des- 
crevendo as métricas usadas para avaliar o desempenho dos modelos de classificação: 

* Precisão: A precisão é a proporção de instâncias corretamente classificadas 


como positivas em relação ao total de instâncias classificadas como positivas. 
Uma precisão alta indica que o modelo tem baixa taxa de falsos positivos. 


* Recall (Sensibilidade): O recall é a proporção de instâncias corretamente clas- 
sifica- das como positivas em relação ao total de instâncias verdadeiramente 
positivas. Um recall alto indica que o modelo tem baixa taxa de falsos negativos. 


e Acurácia: À acurácia é a proporção de instâncias corretamente classificadas em 
relação ao total de instâncias. 


Modelo Desbalanceado Balanceado 
Acurácia | Precisão Recall Acurácia | Precisão Recall 
NB Categórico | 97,24% 97% 97% 97,62% 98% 98% 
TAN 97,88% 98% 98% 98,10% 98% 98% 
k2 98,16% 98% 98% 98,57% 99% 99% 


Tabela 1 — Classificação das medidas de acurácia, precisão e Recall de cada modelo Bayesiano 


Pelos os resultados da Tabela 1, podemos observar o desempenho dos diferentes 
classificadores Bayesianos para dois cenários: desbalanceado e balanceado. 

Em ambos os cenários os três classificadores (NB Categórico, TAN e K2) apre- sentam 
resultados semelhantes em termos de acurácia, precisão e recall. No entanto, o desempenho 
balanceado é ligeiramente superior em comparação com o desbalanceado, o que sugere que 
o balanceamento dos dados pode ser benéfico para melhorar a capacidade de previsão dos 
modelos. 

Todos os modelos alcançaram uma acurácia superior a 97%, o que indica um bom 
desempenho geral, com destaque para o K2, que alcançou uma acurácia de 98,57%. 

A precisão e o recall para todas as classes foram de 97% ou mais, indicando que os 
modelos têm uma baixa taxa de falsos positivos e falsos negativos. 
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Em geral, os classificadores Bayesianos (NB Categórico, TAN e K2) são capazes de 
lidar com eficiência com a tarefa de classificação do atributo alvo COVID-19. 

Para identificar as características mais relevantes para o diagnóstico da COVID-19, 
foi feito uma média de frequência entre as 10 características mais destacadas nas listas de 
ranks retornadas pelos algoritmos, oque indica sua importância consistente na detecção e 
previsão da COVID-19. 

As características encontradas foram: Abroad travel( viagem ao exterior); Breathing 
Problem (Problema respiratório); Sore throat (Dor de garganta); Dry Cough (Tosse seca); 
Attended Large Gathering (Participou de Grande Reunião); Contact with COVID Patient 
(Contato com Paciente com COVID); Fever (Febre); Family working in Public Exposed 
Places (Família trabalhando em locais públicos expostos); Visited Public Exposed Places 
(Visitou locais públicos expostos) e Asthma (Asma - condição preexistente que pode agravar 
o quadro da COVID). 


CONCLUSÃO 


Com a pandemia de COVID-19 e suas mutações, desenvolver tecnologias para 
melhorar o controle de doenças altamente infecciosas é uma tarefa importante e benéfica. 
Este estudo propõe o uso de Redes Bayesianas para auxiliar no diagnóstico do COVID-19, 
os três modelos implementados (NB Categórico, TAN e K2) demonstraram alta eficiência na 
tarefa de classificar a base de dados apresentando resultados semelhantes e valores altos 
de acurácia, precisão e recalltodos acima de 97% indicando a consistência dos modelos e a 
sua capacidade de realizar uma boa classificação das instâncias. 

É interessante observar que com a base de dados balanceada, os modelos tiveram um 
ligeiro aumento na acurácia, precisão e recallem comparação com a base desba- lanceada. 
Isso mostra que o balanceamento dos dados pode ter um impacto positivo no desempenho 
dos modelos. Além disso, incorporar novos dados à base de treinamento pode melhorar a 
eficácia dos modelos e também o possível uso em doenças futuras ou novas pandemias. 

Os modelos demonstraram uma alta capacidade de identificar os fatores de risco, 
eles estão principalmente relacionados a alta transmissibilidade do vírus (viagem ao exterior, 
contato com paciente com COVID, família trabalhando em locais públicos expostos, Visitou 
locais públicos expostos, participou de grande reunião) que pode se propagar de pessoa para 
pessoa por meio de gotículas que se espalham pelo nariz ou pela boca quando uma pessoa 
doente tosse ou espirra. E a sintomas (problema respiratório, dor de garganta, tosse seca, 
febre, asma) característicos da COVID, embora já conhecidos e divulgados pelo Ministério da 
Saúde (MINISTÉRIO DA SAÚDE, [s.d.)), é importante ressaltar essa forma de identificação 
que evidencia a eficácia das Redes Bayesianas para auxiliar no diagnóstico da COVID. 

Por fim, ao utilizar uma boa base de dados, tais modelos são muito eficazes e podem 
ser implementados e utilizados para auxiliar os órgãos públicos a tomar decisões e contribuir 
efetivamente para a contenção da COVID-19 e de doenças futuras. 
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RESUMO: A investigação da série temporal 
é fundamental para o monitoramento 
e administração de sistemas elétricos, 
particularmente no contexto de sistemas de 
energia eólica, onde a capacidade de prever 
a velocidade do vento com elevada precisão 
é crucial. Tal previsão possibilita o despacho 
de energia de maneira eficiente e contribui 
para a mitigação dos riscos associados 
à volatilidade inerente das condições 
eólicas. O presente estudo propõe e 
implementa um modelo de Rede Neural 
Recorrente Multivariada com Memória de 
Curto e Longo Prazo (MV-LSTM do inglês 
Long Short-Term Memory Networks with 
Multiple Variables) para analisar dados de 
velocidade do vento, incluindo medidas 
médias, máximas e mínimas em base 
horária. Adicionalmente, uma Rede LSTM 
univariada foi desenvolvida para servir 
como termo de comparação. Os dados 
empregados neste estudo foram coletados 
por meio de um anemômeiro sônico, 
durante o intervalo de 01 de janeiro a 31 
de dezembro de 2015, em um ecossistema 
de cerrado nativo na Fazenda Água Limpa 
(FAL), situada no Distrito Federal, Brasil. Os 
resultados obtidos indicam que a inclusão 
dos vetores de velocidade máxima e mínima 
aprimora significativamente a precisão das 
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previsões de velocidade do vento. Além disso, o modelo MV-LSTM demonstrou uma redução 
no atraso das previsões em situações de transições abruptas na velocidade do vento, um 
desafio previamente identificado por Xie et al. (2021) em sua pesquisa. Sugere-se que o 
modelo pode ser aperfeiçoado através da adição de camadas adicionais e da integração 
com outros métodos de aprendizado de máquina para otimizar ainda mais o desempenho 
preditivo. 

PALAVRAS-CHAVE: MV-LSTM, Previsão, Energia Eólica 


WIND SPEED FORECAST WITH MULTI-VARIABLE TIME SERIES USING 
RECURRENT NEURAL NETWORK 

ABSTRACT: Investigating time series is crucial for monitoring and administering electrical 
systems, especially in the context of wind energy systems, where the ability to predict wind 
speed with high precision is critical. Such forecasting enables efficient energy dispatch and 
contributes to mitigating risks associated with the inherent volatility of wind conditions. This 
study proposes and implements a Multivariate Long Short-Term Memory (MV-LSTM) model to 
analyze wind speed data, including average, maximum, and minimum hourly measurements. 
Additionally, a univariate LSTM network was developed for comparison. The data used in this 
study were collected through a sonic anemometer, from January 1 to December 31, 2015, in 
a native cerrado ecosystem at Fazenda Água Limpa (FAL) in the Federal District, Brazil. The 
findings indicate that including maximum and minimum speed vectors significantly improves 
the accuracy of wind speed forecasts. Moreover, the MV-LSTM model showed a reduction in 
forecast lag in situations of abrupt wind speed transitions, addressing a challenge previously 
identified by Xie et al. (2021). It suggests that the model could be further enhanced by adding 
additional layers and integrating with other machine learning methods to optimize predictive 
performance. 

KEYWORDS: MV-LSTM, Forecast, Wind Energy 


INTRODUÇÃO 


A análise de dados de séries temporais é fundamental para o controle e 
gerenciamento de diversos sistemas. Atualmente, os sistemas de conversão de energia 
renovável representam os principais motivadores para o desenvolvimento de análises de 
séries temporais (Jin et al., 2020). Séries temporais são importantes para realizar previsões 
de dados futuros e, com isso, planejar quanto de energia será possível despachar em 
determinado período, assim como para o gerenciamento de parques eólicos ou fotovoltaicos 
(Dubey et al., 2021). Portanto, análises de séries temporais de dados de velocidade do 
vento e irradiação solar são bastante estudadas com o objetivo de maximizar a conversão 
de energia. 

Contudo, para prever o futuro dos dados, não basta apenas o valor histórico da 
variável-alvo; outros fatores com influência implícita também devem ser considerados na 
análise (Liang, Nguyen, Jin, 2018; Jin et al., 2020; Dubey et al., 2021). A velocidade do 
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vento pode ser influenciada pela temperatura, irradiação solar, umidade e direção do vento, 
além das condições topográficas. Du (2018) argumenta que, ao realizar análises com 
variáveis multidimensionais que apresentam correlação entre si, a precisão das variáveis- 
alvo da análise é melhorada devido à correlação intrínseca e às características históricas. 

Diversos trabalhos que fazem análise de séries temporais para previsão de dados 
futuros foram publicados nos últimos anos. Dubey et al. (2021) utilizam a Média Móvel 
Integrada Autoregressiva (ARIMA), ARIMA sazonal (SARIMA) e Long Short-Term Memory 
(LSTM) para prever o consumo de energia em uma base de dados diária, e os resultados 
obtidos mostram que o modelo LSTM apresenta melhores resultados. Rashid (2018) 
desenvolveu uma análise de um conjunto de dados de consumo de energia para criar 
um modelo de previsão utilizando ARIMA. Essas análises de big data podem ajudar as 
empresas de energia a melhorar a gestão de energia e serviços. Zufferey et al. (2016) 
aplicam Redes Neurais Artificiais (RNAs) para previsões precisas de carga de curto prazo 
em sistemas fotovoltaicos (PV) e investigam diferentes níveis de agregação espacial. Os 
resultados mostram que o fluxo de energia confirma os benefícios da previsão de séries 
temporais para apoiar a operação da rede. 

Para um controle e gerenciamento inteligente de turbinas eólicas, é importante ter 
informações antecipadas de velocidade do vento para permitir uma operação estável do 
sistema de energia. Yao, Huang e Jia (2018) aplicaram um modelo LSTM em conjunto 
com a teoria dos Conjuntos Fuzzy-Rough (SFR) para a previsão de velocidade do vento 
a curto prazo. Os resultados mostraram que o modelo FRS-LSTM tem maior precisão de 
predição do que a rede neural tradicional. Cao e Gui (2018) utilizaram o modelo LSTM para 
previsão de séries temporais de velocidade do vento em conjunto com o modelo LightGBM. 
Apesar de o LSTM conseguir identificar as dependências de longo prazo, sua capacidade 
de lidar com diferentes janelas de dados no curto prazo para vários intervalos de tempo 
é insuficiente para uma boa previsão. Assim, é comum que o LSTM seja combinado com 
outro modelo de previsão. 

A previsão confiável e precisa da velocidade do vento é a base para a utilização 
eficaz da energia eólica. Shao (2021) utiliza a combinação da rede LSTM e FWA (Firework 
Algorithm) para fazer a previsão da velocidade do vento baseada na velocidade em tempo 
real. Os resultados mostram que o método FWA-LSTM reduz os erros de previsão da 
velocidade do vento. Xie et al. (2021) desenvolveram um modelo LSTM multivariado (MV- 
LSTM) para previsão de velocidade do vento a curto prazo baseado em temperatura, 
pressão e umidade. A seleção das variáveis foi feita a partir do coeficiente de correlação 
de Pearson. O modelo MV-LSTM apresentou resultados superiores aos modelos ARMA e 
LSTM com variável única. Portanto, é evidente que o modelo LSTM tem sido amplamente 
utilizado para previsão de velocidade do vento; no entanto, é necessário desenvolver 
modelos que auxiliem o LSTM a aumentar a acurácia da previsão para alcançar alta 
confiabilidade. 
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Com a inserção dos vetores de velocidade máxima e mínima no modelo, as 
características de curto prazo podem ser mais bem definidas. Dessa forma, este artigo 
propõe um modelo de previsão de velocidade do vento utilizando o modelo LSTM 
multivariado baseado em dados de velocidade média, máxima e mínima horária. Uma 
análise baseada no coeficiente de correlação de Pearson é realizada, e o modelo é treinado 
com dados históricos coletados no Cerrado brasileiro nativo no Distrito Federal. 


MÉTODOS E DADOS 


Descrição do sítio 

O Laboratório de Energia e Ambiente da Universidade de Brasília vem conduzindo, 
ao longo dos últimos cinco anos, um experimento de caracterização da camada limite 
atmosférica sobre uma área de Cerrado brasileiro nativo na cidade de Brasília. O estudo 
utiliza medições experimentais em torres de 8 m de altura com a técnica Eddy Covariance, 
com o objetivo de verificar a dinâmica da camada limite atmosférica e estimar fluxos no 
bioma (ver Fig. 1). Registra-se um conjunto de dados com taxas de aquisição de 10 Hz que 
incluem os componentes tridimensionais da velocidade do vento, as concentrações de H2O 
e CO2, e a temperatura. 
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Figura 1 - Experimento Eddy Covariance. Torre de 8 m sobre área de Cerrado nativo (a); Detalhe do 
anemômetro sônico 3D (b). 
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Os dados foram coletados na Fazenda Água Limpa (FAL), que pertence à 
Universidade de Brasília, localizada no Distrito Federal, com as coordenadas 15º57'13” S 
47º54'58” W. A FAL está localizada a 28 km da sede do Campus Universitário da Asa Norte 
e faz parte da Área de Proteção Ambiental das Bacias do Gama e Cabeça do Veado. Atorre 
com anemômetro sônico foi instalada nas coordenadas mostradas na Fig. 2. 


Parque Ecológic: 


Cachoeira 


o 


Cachoeiradas 


Figura 2 — Localização da torre de coleta dos dados. 


Descrição dos dados 


As séries temporais são agrupadas em valores horários e em bases mensais no 
sentido de estabelecer a resposta sazonal da camada limite atmosférica sobre a área de 
Cerrado nativo. De forma ilustrativa, esses valores são apresentados na Tabela 1. Observa- 
se que, nesta região, os ventos são fracos, com médias em torno de 2 m/s. Em alguns dias, 
a velocidade máxima do vento pode excepcionalmente atingir 5 m/s. A velocidade do vento 
é maior nos meses de junho a agosto, período em que as ondas de frio características do 


inverno local proporcionam ventos mais intensos. 


Velocidade Média (m/s) Velocidade Máxima (m/s) Desvio Padrão 
Jan 1.9 4.8 0.841 
Fev 2.0 5.8 1.002 
Mar 1.6 41 0.790 
Abr 1.5 4.8 0.769 
Mai 1.9 5.2 0.832 
Jun 2 5.7 0.858 
Jul 241 6.2 0.995 
Ago 2.3 5.0 1.021 
Set 1.9 4.9 0.940 
Out 1.9 4.9 0.974 
Nov 1.8 6.6 0.932 
Dez 1.8 4.8 0.847 


Tabela 1 - Valores médios mensais de vento em torre de 8 m sobre o Cerrado. 
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Neste estudo, os dados da série temporal de todos os elementos meteorológicos 
foram usados para prever a velocidade do vento a curto prazo. As observações foram 
feitas entre 1 de janeiro e 31 de dezembro de 2015 e agrupadas em médias horárias. 80% 
dos dados totais (292 dias x 24 h = 7008 amostras de dados) foram usados para treinar 
o modelo, e os últimos 20% dos dados totais (73 dias x 24 h = 1752 amostras de dados) 
foram usados para testar o modelo. Para abordar a questão dos valores ausentes, o valor 
médio dos dois pontos de dados antes e depois do ponto de dados ausente foi utilizado 


para reposição. 


Long Short-Term Memory (LSTM) 


Em 1997, Hochreiter et al. (1997) propuseram o modelo de rede Long Short-Term 
Memory (LSTM), que incorpora memória de curto e longo prazo através de um mecanismo 
de controle de portas, mitigando assim o problema de desaparecimento ou explosão de 
gradientes encontrado em Redes Neurais Recorrentes (RNNs). A Fig. 3 ilustra a estrutura 
básica de uma célula LSTM. A rede é composta por uma célula com uma porta de saída 
T, uma célula de memória €, uma porta de entrada T,e uma porta de esquecimento T,. W 
e U representam as matrizes de pesos compartilhados dos neurônios, h, é o estado oculto 
no momento t, x, é a entrada da rede no momento t, e o e tanh são a funções de ativação. 


he-a 


Xt 

a Bobo o AE ua BN ué 
| Cor; é! Fe: E 
Voa Doi Poi 
| portadesaída ! célula dememória; ! portadeentrada /  ! porta de esquecimento | 

| 

he Ct-1 
a 


memória velha 


q ) C 
Memória nova 


Figura 3 — Estrutura básica de uma célula da rede LSTM. 


A rede LSTM funciona a partir do controle dos gates. A porta de esquecimento 
determina quais informações da memória velha é descartada ou retida. Com h,, e x, 
uma saída de O e 1 é obtida, onde O significa descartado e 1 retido. A saída da porta de 


esquecimento é dada pela Eq. (1) 
Et = o(Uphe-s + Wexr IE bp), (1) 
em que, b, é o vetor de polarização. 
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A porta de entrada determina as informações que são adicionadas à célula e tem 
como função gerar informações para as funções tanh e sigmóide de modo combinado com 
a porta de esquecimento e atualiza o estado da célula da rede LSTM. As informações são 
dadas pelas Eq. (2) e Eq. (3). 


Tie = 0(Uihe- + Wixi + bi) (2) 


E = tanh(Uçh; 4 + W.x, + De) (3) 


A última etapa da célula de uma rede LSTM é A porta de saída. É na porta de saída 
que as informações do estado atual da célula são determinadas e em conjunto com as 
funções sigmóide e tanh calcula a saída da célula. As informações da porta de saída são 
calculadas pelas Eq. (4) e Eq. (5) 


Lo = 0(Uçhe-s + Wox, + Do), (4) 


h, = Cotanh(co), (5) 


Rede Long Short-Term Memory Multivariado (MV-LSTM) 


Neste artigo, é proposto um modelo LSTM multivariado para previsão de dados 
de velocidade do vento a curto prazo baseado nas velocidades média, máxima e mínima 
horária. As características dos dados são analisadas a partir do coeficiente de correlação 
de Pearson. A estrutura do modelo é mostrada na Fig. 4. 

A seleção das variáveis de entrada para o modelo foi definida com o objetivo de 
verificar se inserindo dois vetores com velocidade máxima e mínima ao modelo os resultados 
previstos melhoram. A correlação de Pearson foi utilizada para verificar o quanto esses 
vetores se correlacionam. Variáveis correlacionada melhoram os resultados previstos para 
o modelo MV-LSTM apresentado por Xie et. al (2021). Porém, os valores máximo e mínimo 
ainda não apresentam bons resultados devido o modelo apresentar instabilidades com 
esses dados. O coeficiente da correlação de Pearson pode ser calculado pela Eq. (6) 


cov(x,y) 


E) = “axoy (6) 


em que, r(x,y) é o coeficiente de correlação de Pearson entre x e y, cov(x,y) é a 


covariância entre xe y, ox é o desvio padrão de x e ox é o desvio padrão de y. 
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Seleção das variáveis 


Velocidade média horária Normalização dos 


dados 
Velocidade máxima horária 


Velocidade mínima horária Formatação dos dados 


MV-LSTM 


Modelo de 
treinamento 


Resultados 


Modelo de predição 


| 


Figura 4 — Estrutura da rede LSTM multivariável proposta para previsão da velocidade do vento 
descrita em quatro etapas de desenvolvimento. 


Para garantir que as variáveis de entrada tenham escalas e estruturam semelhantes 
emtodos os vetores é necessário a normalização. Os valores máximo e mínimo são utilizados 
para normalizar os dados de treinamento e teste. Todos os vetores são normalizados a 
partir da Eg. (7). 


y Vi Ymin 
inorm , 
Vmax — Vmi 
max min (7) 
em que, V, m SãO OS valores do recurso normalizado para o tempo i, Ve V,., São 


os valores máximo e mínimo do conjunto de dados para um recurso, v, são os valores real 
no tempo i. Todos os dados foram normalizados e escalonados entre O e 1. 

O próximo passo é formatar os dados de forma que todos os vetores de velocidade 
se tornem uma matriz de entrada no modelo MV-LSTM. Para configurar a rede MV- 
LSTM foi utilizado a biblioteca Python chamada Keras. Sendo uma rede de aprendizado 
supervisionado, LSTM precisa ter duas partes de dados. Dessa forma, os dados são 
divididos em amostra e os rótulos correspondentes, ou seja, entrada x e saída y, onde 
a entrada x representa os dados de amostra e y representa o rótulo correspondente aos 
dados de amostra. Portanto, os conjuntos de treinamento e teste precisam ser formatados 
em duas partes x e y. As amostras de velocidade são representadas pelo vetor v,=(V 


V 


máxima” 


matriz contendo todos os vetores de acordo com a Eq. (8) e Eq. (9). 


V 


mínima! 


), assim a formatação dos dados pode ser feita a partir da montagem de uma 


X1 vy Vo ve 

X2| |V V3 Va 

Xn Va Unte Ven (8) 
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1 Yi 
Y2)  |Yt+2 


Yn Yt+n (9) 

em que, x, é a amostra de um recurso, v são as observações dos dados no tempo i. 

Os dados do conjunto de treinamento formatado são utilizados para treinar o modelo 
de rede LSTM. Arede aprende de forma iterativa de modo que os parâmetros de peso são 
otimizados para o modelo aprender as características dos dados. A Tab. 2 mostra os hiper 
parâmetros do modelo de rede LSTM. 


Parâmetros VALOR 

epoch size 30 
batch size 64 

neuron size 12 

loss function mean absolute error (MAE) 
optimizer adaptive moment estimation (adam) 


Tabela 2 — Hiper parâmetros da rede MV-LSTM. 


A última etapa do processo foi a previsão da velocidade do vento com o modelo da 
rede MV-LSTM treinado com o conjunto de teste foi usada como a entrada do modelo, e o 
modelo treinado tem como valor previsto yn” como mostrado na Eq. (10). Com os dados de 


testes e com os valores previstos o modelo calcula-se o valor do erro a partir da Eq. (11). 


mA Ina 
m 2 dé t+2 
yr t+n 


mae = 15 = yn'; 
mA nl 


(10) 
(1) 


Métricas de avaliação 


Para avaliar o desempenho do método MV-LSTM foi empregado as quatro métricas 
quantitativas que são as mais utilizadas. O erro foi calculado a partir do Mean absolute erro 
(MAE), R-squared (R?), a raiz do erro quadrático médio (RMSE) e erro quadrado médio 
(MSE). O MAE, RMSE, MSE e Rº são definidos da seguinte forma: 


n 
1 
MAE =—5 by — mil, 
iz (12) 
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n 
1 
RMSE = [5 Gu om'n?, 
i=1 


(13) 


n 
1 r 
MSE=5 um), 
i= (14) 
Lan — Inn? 


Rê=1- = 
Diei0 — Ini) 


(15) 
em que, y, é a observação da velocidade do vento no tempo ie yn' é a previsão da 
velocidade do vento no tempo i. 


RESULTADOS E DISCUSSÕES 


A partir dos dados de velocidade média, máxima e mínima para cada hora do ano de 
2015 foi calculado a matriz dos coeficientes da correlação de Pearson. Os coeficientes são 
apresentados no gráfico da Fig. 5. Como era esperado as velocidades máxima e mínima tem 
alta correlação com a velocidade média, mas a velocidade mínima é menos correlacionada 
com a velocidade máxima do que a velocidade média. É importante destacar que outros 
parâmetros meteorológicos apresentam correlação com as mudanças na velocidade 
do vento, no entanto, para este artigo foi considerado apenas as velocidades máxima e 
mínima horária em conjunto com a velocidade média, de modo a melhorar a previsão de 
uma rede LSTM multivariável. O coeficiente da correlação de Pearson varia de -1 a 1. 
Quando as variáveis apresentam alta correlação o coeficiente é igual a 1 e quando são 
totalmente descorrelacionadas é igual a -1. No caso, das variáveis utilizadas nesse estudo 
são altamente correlacionadas, visto que, são dados de velocidade do mesmo dataset. 


-100 


- 0.75 


' 
a 


0.99 0.99 0.50 


0.25 


0.99 1 0.95 0.00 


vel max vel med 


—0.25 


0.99 0.95 1 —0.50 


vel min 


-0.75 


' ' ] = 1.00 
vel med vel max vel min 


Figura 5 — Correlação de Pearson para os três vetores de velocidade. 
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Os resultados de predição dos métodos LSTM e MV-LSTM são mostrados como 
os valores das métricas de avaliação nas Tab. 3, onde o melhor desempenho é destacado 
em negrito. Os valores de RMSE mostram que o modelo MV-LSTM tem um desempenho 
melhor do que o modelo LSTM. O método MV-LSTM pode lidar bem com os picos de 
velocidade. A Fig. 6 apresenta o erro médio absoluto para os dados de treino e teste para 
o modelo MV-LSTM. O erro do teste é um pouco maior do que o de teste, de certo modo, 
esse é um comportamento esperado. 


Métodos MAE RMSE MSE R2 
LSTM 0.24 0.096 0.0094 0.54 
MV-LSTM 0.0394 0.061 0.0037 | 0.602 


Tabela 3 — Os valores métricos de avaliação para os dois modelos no conjunto de teste. 
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Figura 6 — Curva do erro médio absoluto do modelo VM-LSTM. 


Comparando os dados de teste com os dados preditos foi verificado que os picos 
de velocidade para a rede MV-LSTM com dados de velocidade máxima e mínima diária 
melhora a previsão dos picos de velocidade média em comparação com as previsões feitas 
com a rede LSTM com uma variável. A Fig. 5 apresenta as três curvas com destaque 
para o detalhe de dois picos de velocidade em que o modelo MV-LSTM apresenta valor 
mais próximo do valor observado e resolve o atraso quando se tem uma mudança de 
velocidade brusca. No trabalho de Xie et. al (2021) o modelo MV-LSTM implementado 
apresenta melhoria na previsão, porém continua com atrasos quando há uma mudança 
brusca de velocidade. 
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Figura 7 — Dados de testes da rede LSTM e VM-LSTM. 


Com as informações dos picos de velocidade horária o modelo aprende as 
mudanças bruscas dos dados e com isso as informações de picos máximo e mínimos não 
são descartadas. Diferentemente quando não tem os valores dos picos das mudanças 
repentinas o modelo descarta, visto que, com os valores médios esses picos apresentam 
em menor magnitude e menor período. Com os dados de máximo e mínimo de hora em 
hora modelo MV-LSTM aprende as características dos dados e desenvolve uma previsão 


com maior acurácia. 


CONCLUSÕES 


Neste artigo, é proposto um modelo de rede neural recorrente multivariada do tipo 
memória de curto longo prazo (MV-LSTM) para previsão de velocidade a curto prazo. Sendo 
um modelo multivariáveis pode-se prever velocidade do vento a partir de dados históricos 
de velocidade média, máxima e mínima horária para previsão de velocidade do vento. O 
modelo foi verificado a partir de dados histórico de uma torre com anemômetro sônico da 
Laboratório de Energia e Ambiente -UnB que realizou medições entre 01 de janeiro de 2015 
a 31 de dezembro de 2015. 

O resultado do modelo MV-LSTM é comparado com resultado do modelo LSTM 
com única variável de entrada. As observações experimentais mostram que o desempenho 
do modelo MV-LSTM apresenta desempenho de previsão melhor que a rede LSTM de 
variável única com base apenas em dados históricos de velocidade média do vento. A 
rede MV-LSTM implementada com as velocidades máximas e mínimas retirou o atraso na 
previsão da velocidade quando há uma alteração brusca, como em uma rajada de vento. 
Isso é importante, pois os modelos utilizados atualmente não lidam muito bem com as 
instabilidade e volatilidade dos dados de velocidade do vento. 
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O modelo implementado não foi testado com outro conjunto de dados. No entanto, 
a próxima etapa vai ser implementar o modelo para outro dataset de dados e otimizar 
a capacidade de aprendizado do modelo, bem como implementar Gated Recurrent Unit 
Network (GRU) que é um modelo de aprendizado de máquina supervisionada e fazer 
comparações. Com base nisso, consideraremos otimizar a capacidade de aprendizado do 
modelo aumentando sua complexidade, como adicionando camadas de rede e combinando 
outras redes neurais, melhorando assim a precisão de previsão do modelo para velocidades 
do vento com maior instabilidade e volatilidade. 
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CAPÍTULO 7 
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RESUMO: A robótica tem sido de grande 
ajuda ao homem para completar inúmeras 
tarefas, ela é empregada em diversos 
lugares como hospitais, aeroportos, fá- 
bricas, entre outros. A visão computacional 
é utili- zada em conjunto com a robótica a 
fim de obter in- formações do ambiente, 
entretanto, isso requer um grande poder de 
processamento, visto que grande parte dos 
trabalhos desenvolvidos recentes na área 
de detecção de objetos utilizam de redes 
neurais ro- bustas, inviabilizando o uso 
de sistemas embarcados de baixo custo. 
Este artigo apresenta um sistema de baixo 
custo para detecção e rastreamento de uma 
pessoa usando uma câmera RGB em tempo 
real, para isso desenvolveu-se um sistema 
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de controle de movimento de robô utilizando 
apenas os parâmetros obtidos da detecção. 
PALAVRAS-CHAVE: Robótica; Detecção 
de objetos; Rastreamento; MobileNet; Baixo 
custo 


INTRODUÇÃO 


A Robótica é um campo que 
reúne várias áreas do conhecimento, tais 
como mecânica, eletrônica, in- formática, 
inteligência artificial, engenharia de con- 
trole, entre outras. 

A robótica é capaz de proporcionar 
maior flexibilidade, melhoria da qualidade 
de trabalho e au- mento da segurança 
ocupacional (SIEGWART et al., 2011). 
Por este motivo, a robótica tem sido uti- 
lizada em um grande número de processos 
industri- ais, tais como: manutenção de 
produtos, soldagem, aplicação de produtos 
(pintura, colagem...) carga e descarga 
de máquinas, mecanização, processos de 
corte, montagem de produtos, paletização, 
medição, inspeção e etc. (TURIEL et al., 
2002). 
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Embora na atualidade os robôs industriais exe- cutem múltiplas tarefas com grande 
precisão e ra- pidez, a principal desvantagem que apresentam é a sua falta de mobilidade, 
podendo atuar apenas den- tro da sua área de trabalho, entendendo-a como o volume do 
espaço definido através os pontos aces- síveis pelos elementos do robô (SIEGWART et 
al., 2011). 

Dentro da robótica está a robótica móvel, um ramo que se concentra no estudo da 
mobilidade de robôs. Nele, a maioria das aplicações se con- centra tanto na teleoperação 
de robôs, quanto em seu comportamento autônomo (BRADSKI; KAEH- LER, 2008). 

Na robótica móvel, um dos aspectos fundamentais é a obtenção de informações do 
ambiente em que o robô opera. Para isso, robôs móveis contam com múltiplos sensores, 
como sensores de proximidade, pressão, sensores de luz... Apesar da quantidade de 
informações que podem ser extraídas desses senso- res serem limitadas, eles têm sido 
utilizados em um grande número de trabalhos porque as informações desses sensores 
são muito fáceis de processar e in- terpretar. Uma das opções de sensoriamento mais 
importante hoje é a visão computacional, pois de uma imagem é possível extrair uma 
grande quan- tidade de informações como distância, localização, posição, formas e cores 
do objeto. 

As principais desvantagens da visão computacio- nal em robôs são o custo 
computacional necessário para extrair e processar as informações da imagem, bem como 
a dependência das condições ambientais, em termos de iluminação, presença de objetos, 
etc. Esse custo não seria um problema em outras áreas, mas na robótica móvel é, uma vez 
que a maioria das operações em robôs deve ser realizada em tempo real. 

Neste trabalho, é apresentado um sistema robó- tico de baixo custo capaz de lidar 


com processa- mento de imagens, assim como utilizar desse recurso para seguir pessoas. 


COMPONENTES DO SISTEMA 


Raspberry Pi 


O Raspberry Pi é um computador em placa única do tamanho de um cartão de 
crédito, mas que pos- sui todos os componentes que um computador de custo mais elevado. 
Esta é uma placa de baixíssimo custo, tornando-a extremamente atrativa, versátil e viável 
para desenvolvimento de projetos (LIMA et al., 2020). 

O modelo utilizado nessa pesquisa trata-se do Rasbperry Pi 3 B+, portando um 
processador Cortex-A53 (ARMv8) quad-core de 1.4GHz, 1GB de memória RAM, 40 pinos 
GPIO, 4 portas USB, entrada para cabo Ethernet, suporte a Wi-Fi, en- trada para fonte DC 
de 5V/2.5A e saída HDMI. 
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OpenCV 


OpenCV é uma biblioteca de funções de progra- mação voltadas principalmente 
para a visão com- putacional em tempo real. Desenvolvida original- mente pela Intel, a 
biblioteca é múlti plataforma e gratuita para usar sob a licença de código aberto BSD 
(BRADSKI; KAEHLER, 2008). 

Ela possui mais de 2.500 algoritmos otimizados, que incorporam um conjunto 
abrangente de funções relacionadas tanto a visão computacional clássica, quanto a atual. 
Esses algoritmos podem ser usados para detectar e reconhecer rostos, classificar objetos, 
classificar ações humanas em vídeos, rastrear movi- mentos de câmera, etc. Todas as 
estruturas de ar- rays OpenCV são convertidas para arrays Numpy. Portanto é possível 
combinar operações realizadas no Numpy com o OpenCYV, o que diminui imen- samente o 
número de limitações (SEKHAR; RAO, 2019). Utilizou-se essa biblioteca visando ler, mos- 
trar e fazer um pré-processamento da imagem ob- tida através da câmera. 


MobileNet 


Para a detecção de pessoas utilizou-se o modelo MobileNet. Este trata-se de uma 
classe de mode- los eficientes, que se concentra principalmente em aplicativos móveis 
e sistemas embarcados de visão computacional. O motivo principal da utilização desse 
modelo é a razão entre a eficiência o custo processamento. Para fazer essa otimização 
ela usa um conceito novo para reduzir a sua complexidade computacional: Convolução 
Separável em Profundi- dade. 

Para melhor compreensão, será feito uma revi- são do modelo, baseado no artigo 
(HOWARD et al., 2017). 


Convolução separável em profundidade 


é uma convolução em profundidade seguida por uma convolução pontual, seu 
modelo é representado na Figura2.1. 
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Figura 2.1: Convolução em profundidade seguida por uma convolução pontual. Imagem retirada e 
modificada de (SCIENCE, 2018) 


Convolução pontual é a convolução espacial DK x DK em canais. Supondo que na 
Figura2.1, te- nhamos 5 canais, então tem-se 5 convolução espa- cial DK x DK. Convolução 
pontual na verdade, é a convolução 1 x 1 para alterar a dimensão. 

Com a operação acima, o custo de operação é: 


De DM: D+M-N-D,. D, 
onde M: Número de canais de entrada, N: Número de canais de saída, DK: Tamanho 


do kernel e DF: Tamanho do mapa de características. 
Para convolução padrão, é: 


DK-DK-M-N-DF-DF (2.1) 
Assim, a redução do cálculo é: 


— + 
yo oh (2.2) 

Quando DK x DK é 3 x3, 8 a 9 vezes menos computação pode ser obtida, mas com 
apenas uma pequena redução na precisão. 
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Estrutura do modelo 


Exceto a primeira camada, que se trata de uma convolução tradicional, as demais 
camadas da ar- quitetura MobileNet são baseadas em convoluções DSC. A última é 
completamente conectada, seguida por uma Softmax. 


Type 7 Sinide Input Size 
Conv/s2 224 x 224 x 3 
Conv dw / sl 3x 3x 32 dw 112 x 112 x 32 
Conv /sl 112 x 112 x 32 
Conv dw / s2 3x 3x 64 dw 112 x 112 x 64 
Conv /sl 56 x 56 x 64 
Conv dw / sl 3x 3x 128dw 56 x 56 x 128 
Conv dw / s2 3x 3x 128dw 56 x 56 x 128 
Conv /sl 28 x 28 x 128 
Conv dw / sl 3x 3x 256 dw 28 x 28 x 256 
Conv /sl 28 x 28 x 256 
Conv dw / s2 3x 3x 256 dw 28 x 28 x 256 
Conv /sl 14 x 14 x 256 
5» Conv dw / sl 14 x 14 x 512 
Conv/sl 1x 1x 512x 512 14 x 14 x 512 
Conv dw / s2 14 x 14 x 512 
Conv /sl 1x 1x 512x 1024 7x7x 512 
Conv dw / s2 Tx7x 1024 
Conv /sl 1x 1x 1024x 1024 | 7x7 x 1024 
Avg Pool/sl Tx7x 1024 
FC/sl 1024 x 1000 1x 1x 1024 
Softmax / sl 1x 1x 1000 


Figura 2.2: Arquitetura do modelo Mobilenet. Ima- gem retirada de (SCIENCE, 2018) 


Através da Figura 2.2, nota-se a utilização da es- tratégia de regularização 
batchnormalization, carac- terizada pela normalização em lote (BN) e ReLU aplicadas após 


cada convolução. 


Robô 


Visando montar um sistema de baixo custo, utilizou-se um robô genérico, exibido 
na figura 2.3, com 2 motores de 3-6V. Para controle dos motores empregou-se um Driver 
Ponte H conectado ao Raspberry e 6 pilhas alcalinas em série para alimentação. 


Além disso, uma webcam foi acoplada ao protó- tipo para obtenção das imagens. 
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Figura 2.3: Protótipo do robô. 
Cálculo das 
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Figura 3.1: Fluxograma do código desenvolvido 


TRABALHO DESENVOLVIDO 


O fluxograma completo para o robô que segue pessoas pode ser divido nas seguintes 
quatro par- tes (fig. 3.1). 

A Rede Neural Convolucional MobileNet foi uti- lizada para detectar pessoas em 
um determinado quadro RGB. Ao passar a imagem RGB no modelo e uma pessoa ser 
detectada, é retornado a coorde- nada cartesiana da caixa delimitadora. Para que sejam 
feitas as estimativas e correções, é calculada a centroide com os valores obtidos. 

O sistema de coordenadas cartesiano do robô pode ser observado na figura 3.2. 
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Figura 3.2: Sistema de coordenadas do robô 


O controle de movimento é feito a partir de um mecanismo de acionamento diferencial. 
Esse sis- tema é baseado em parâmetros definidos previa- mente, e que podem ser ajustados 
de acordo as ne- cessidades do usuário, estes preceitos serão chama- dos de tolerância. 

Quando o usuário estiver fora do limite definido como tolerável, serão feitos ajustes 
no movimento do robô para que os valores da centroide esteja dentro dos parâmetros 
estabelecidos, para facilitar o enten- dimento esse processo foi ilustrado na figura 3.3, as 


linhas verdes são os limites determinados anterior- mente. 


IE 


Figura 3.3: Mecanismo de acionamento diferencial 


Para controle de quando seguir em frente ou pa- rar, o Y final é utilizado como base. 
Quando esta coordenada estiver acima dos parâmetros estabele- cidos, o robô andará até 
o Y final ficar a baixo da tolerância. 

O manuseio de curvas é feito com base nos pa- râmetros relacionados ao eixo X. O 
posicionamento do usuário será estimado utilizando a média entre o X inicial e final, este 
valor será comparado com os parâmetros de tolerância, caso seja maior o robô virará à 
esquerda e caso seja menor o robô virará à direita, esses movimentos serão feitos até que 


a centroide esteja dentro da projeção estipulada. 
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CONCLUSÃO 


O objetivo geral da pesquisa foi alcançado, como apresentado nesse artigo, um 
sistema de baixo custo baseado em visão computacional e aprendizado pro- fundo para 
detecção e rastreamento de pessoas em tempo real foi desenvolvido. 

Esse sistema viabiliza que mais pesquisas e protó- tipos possam ser desenvolvidos, 
afinal toda a neces- sidade de equipamentos caros e robustos está sendo eliminada. 

Na versão atual, o sistema robótico rastreia uma pessoa através do modelo 
MobileNet e mediante os resultados obtidos é calculado as coordenadas car- tesianas e o 
valor médio das mesmas. A partir des- ses dados é feito o controle de movimento do robô, 
um sistema de navegação autônomo baseado em vi- são computacional foi desenvolvido 
com o propósito de manter o baixo custo do protótipo, descartando a necessidade de 
sensores adicionais e/ou câmeras depth sense. 
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CAPÍTULO 8 


ROBÓTICA EDUCACIONAL: ALIMENTADOR 
AUTOMÁTICO PARA CÃES DE RUA 


Rute Maria Rosa 


RESUMO: A tecnologia está presente na 
nossa vida o tempo todo, através dela é 
possível desenvolver soluções para vários 
problemas do nosso cotidiano. O avanço 
tecnológico fez com que até mesmo jovens 
estudantes pudessem ter acesso a robótica. 
Um dos problemas sociais enfrentados 
no Brasil, é o abandono aos animais de 
rua (GONÇALVES, 2016). A ideia central 
é a realização de uma campanha que 
incentive as pessoas a cuidarem dos 
animais de rua, caso não seja possível a 
adoção, alimentando-os com um dispositivo 
acoplado ao portão da sua residência 
feitos com materiais de baixo custo. Desta 
forma, este artigo tem como objetivo 
propagar o uso da robótica educacional 
com alunos do 2º do Ensino Médio na 
criação de um alimentar automático para 
animais de rua. O alimentador automático 
foi produzido de forma simples, não 
exigindo uma programação complexa 
para seu funcionamento. Conclui-se que é 
necessário o incentivo não só em questões 
técnicas, como também metodologias que 
desenvolvam a criticidade e autonomia dos 
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estudantes, frente as necessidades sociais. 
Por isso, quanto mais direcionamentos em 
questões como essas, maiores serão os 
resultados que podem ser aplicados na 
melhoria da sociedade como um todo. 
PALAVRAS-CHAVE: Robótica, Educação, 
Animais, Tecnologia 


EDUCATIONAL ROBOTICS: 
AUTOMATIC FEEDER FOR STREET 
DOGS 


ABSTRACT: Technology is present in our 
lives all the time, though it is possible to 
develop solutions to various problems in our 
daily lives. Technological advances have 
made it possible for even young students to 
have access to robotics. One of the social 
problems faced in Brazil is the abandonment 
of stray animals (GONÇALVES, 2016). 
The main idea is to carry out a campaign 
that encourages people to take care of 
stray animals, if adoption is not possible, 
feeding them with a device attached to 
the gate of their residence, made with 
lowcost materials. Thus, this article aims to 
propagate the use of educational robotics 
with high school students in the creation 
of automatic food for stray animals. The 
automatic feeder was produced in a simple 
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way, not requiring complex programming for its operation. It is concluded that it is necessary 
to encourage not only technical issues, but also methodologies that develop criticality and 
autonomy of students, given social needs. Therefore, the more directions on issues like these, 
the greater the results that can be applied to improve society as a whole. 

KEYWORDS: Robotics, Education, Animals, Technology 


INTRODUÇÃO 


Atualmente a tecnologia tem feito parte da vida das pessoas, através dos meios 
de comunicação, transportes, eletroeletrônicos, entre outros. Estes são alguns exemplos 
utilizados diariamente, porém a grande maioria não compreende corretamente como é o 
funcionamento desses equipamentos. Por isso têm-se discutido a inserção de conceitos de 
lógica e programação de computadores na educação básica, de acordo com o pesquisador 
Seymour Papert, a robótica é tão essencial quanto outras disciplinas devido à sua presença 
diária na sociedade. 

Desenvolver algoritmos a partir do pensamento lógico auxilia em várias áreas de 
conhecimento, principalmente em tarefas relacionadas a programação, quando esses 
conceitos são utilizados nas situações cotidianas ou na resolução de situações problemas, 
gera motivação e interesse por parte dos alunos. Uma forma de oportunizar o conhecimento 
cientifico- tecnológico é desenvolver a inventividade e a experimentação a partir do lúdico, 
assim a robótica permite a promoção de conceitos multidisciplinares na sala de aula. 

O envolvimento e a intervenção dos alunos em problemas sociais, como os maus 
tratos aos animais de rua, é possível a partir de uma pratica pedagógica significativa. Assim 
o ensino de Robótica é ampliado ao elaborar construções que levem os alunos a resolverem 
questões com o uso de criatividade e a inventividade tecnológica. 

O presente artigo tem como objetivo propagar o uso da Robótica Educacional com 
alunos do 2º do Ensino Médio na criação de um alimentar automático para animais de rua. 
Tendo como ponto principal a resolução de uma situação-problema através da tecnologia 
e do uso de materiais recicláveis. A ideia deste protótipo é a realização de uma campanha 
que incentive as pessoas a cuidarem dos animais de rua, caso não seja possível a adoção, 
alimentando-os com um dispositivo acoplado ao portão da sua residência feitos com 
materiais de baixo custo. 

Este trabalho está dividido em cinco seções, sendo a segunda a apresentação 
dos conceitos relacionados a Robótica Educacional e o uso de ferramentas na educação 
básica como ferramentas como LEGOEMINDSTORMSO Education EV3, na Seção 3 há 
a descrição da metodologia; na Seção 4 serão discutidos os resultados e na Seção 5 a 
exposição das conclusões. 
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ROBÓTICA NA ESCOLA 


Nesta seção serão discutidos o que é a Robotica Educacional e o uso da ferramenta 
LEGOGMINDSTORMSE Education EV3 para melhor percepção das circunstâncias que 
acompanham a realização do projeto. 


Robótica Educacional 


A robótica se refere ao desenvolvimento de diversos dispositivos que auxilia o 
homem em situações adversas ou mesmo em atividades que requer uma repetição do 
processo. Sendo conhecida como a “ciência dos sistemas que interagem com o mundo 
real, com pouco ou mesmo nenhuma intervenção humana” (MARTINS, 2006). 

Atualmente, estudos nessa área permitem a criação de artefatos que vão além 
das industrias automobilisticas, têxtil, agronegócio, alimenticias, entre outras. Chegando 
também nas escolas, ao deixar de produzir apenas robôs para se tornar também um 
instrumento no processo de ensino- aprendizagem (ABREU, 1999). 

A Robótica Educacional considerada também como Robótica Pedagógica, é 
encontrada em ambientes educacionais como auxilio na montagem e desmontagem de robôs 
ou sistema robotizado, fornecendo aos estudantes momentos de lazer e entretenimento na 
aprendizagem (SANTOS et al. 2016). 

Os espaços escolares que contenham materiais como sucatas ou kits utilizados em 
programação de dispositivos, como peças, sensores e motores, são ferramentas para a 
Robótica Educacional. Esses ambientes permitem o desenvolvimento de habilidades como 
raciocínio lógico, criatividade e trabalho em equipe (GERBER et al. 2017). 

A partir da identificação de um problema, o aluno será incentivado a solucioná-lo de 
uma forma lógica, com o auxílio de um robô. Esse processo permite que seja desenvolvido 
a Robótica Educacional, pois durante a programação do robô, com uso da liguagem 
apropriada, ocorrerá uma sequência de causa/ efeito para a a obtenção da ação que se 
deseja, formentando o desenvolvimento do raciocínio lógico (CASTILHO, 2002). 

Ao desenvolver a programação, o aluno poderá testá-la, caso os testes não 
correspondam satisfatoriamente, é possivel a reprogramação do processo até que se 
chegue ao resultado esperado. Dessa forma, o aluno terá a oportunidade de refletir sobre 
suas ações, corrigindo os erros quando necessário. 

O ato de montar e desmontar um robô, ou fazer uma programação e testá-la, faz 
com que o aluno crie conexões neurais muito complexas, de forma singular, auxiliando na 
sua capacidade cognitiva (CASTILHO, 2002). 

A escola contribui de forma positiva para a sociedade emergente, pois ela passa a 
corresponder às novas exigências sociais e históricas que a humanidade está vivenciando 
(FREIRE & GUIMARÃES, 2003). Isso permitirá a potencialização do ensino- aprendizagem, 
através dos desafios propostos aos alunos, incentivando-os a sistematizar suas ideias, testar 
hipóteses e buscar a efetivação da atividade por intermédio do pensamento investigativo. 
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Kit LEGO Mindstorms Education EVS 


A plataforma educacional da LEGO é fundamentada em quatro eixos: aprender a 
conhecer; aprender a fazer; aprender a viver juntos; e aprender a ser (DELORS, 2012). 
Considerando também que o aprender a agir é muito importante no desenvolvimento das 
atividades. É um instrumento muito utilizado pelos professores de robótica, pois permite a 
construção do conhecimento através da experimentação, trazendo para a realidade do aluno. 

O kit LEGO Mindstorms é composto por componentes que viabilizam a transmissão 
de dados e o seu processamento, por sensores, atuadores e peças que vão desde conexão 
até transmissão de movimentos (LEGO, 2006). 

Cada kit possui uma maleta contendo 541 peças de plastico e borracha, apresentando 
diferentes tamanhos e cores, assim como blocos inteligentes que podem armazenar a 
programação, que se conecta a um cabo USB com o computador. 

O LEGO MINDSTORMS Education EV3 possui uma versão pré-instalada do 
próprio aplicativo. Assim o aluno tem acesso a plataforma que é composto por blocos EV3 
possuindo o fimware atualizados e sua bateria, que serão conectados por via Bluetooth na 
sala de aula. Isso facilita a compreensão lógica através do uso de uma linguagem gráfica 
para a realização das atividades. 


A CRIAÇÃO DO ALIMENTADOR AUTOMÁTICO PARA ANIMAIS DE RUA 


Um problema que ocorre frequentemente em regiões urbanas é o maltrato aos 
animais, principalmente em situação de abandono. Pensando nesta dificuldade, com o 
intuito de minimizá-la, os alunos do 2º ano do ensino médio da escola SESI- 424 propuseram 
a criação de um alimentador automático que pudesse atender à necessidade básica de 
alimentação desses animais. Após várias pesquisas de projetos semelhantes, buscou-se 
um protótipo feito com materiais de baixo custo e acessível a comunidade. 

O alimentador foi criado para ser acoplado a um portão residencial e com materiais 
recicláveis, com o intuito de reprodução do projeto pela comunidade. A partir da união de 
canos de PVC e um dispositivo com sensor que libera a ração sempre que um animal se 
aproxime. 

A ração é colocada em pequenas quantidades na parte superior do alimentador, 
podendo armazená-la e liberar quando o sensor fosse acionado. 

A ideia inicial é propagar a campanha de alimentação e cuidado com animais de rua 
de forma voluntária. Uma maneira que os alunos encontraram para divulgar essa ação, foi 
o uso da robótica na criação desse dispositivo e o incentivo a sua reprodução por parte 
da comunidade ao redor da escola. Dessa forma, o protótipo pode ser criado sem obter 
conhecimentos em programação e o uso de materiais do cotidiano, que poderiam ser 
descartados, mas que serão úteis nesse projeto. 
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MATERIAIS E MÉTODOS 


Para a parte física do material, usou-se canos de PVC encontrados em áreas de 
reciclagem, conforme a Figura 1, rosca sem fim e o kit Lego EV3 para a programação. 


Figura 1: Canos de PVC 
Fonte: Autores, 2021 


Na rosca sem fim foi acoplado um cano de PVC, para armazenamento da ração, 
conforme a Figura 2. Quando a rosca gira, o alimento chega até o final, caindo na bandeja. 


Figura 2: Montagem do dispositivo 


Fonte: Autores, 2021 


Com a estrutura organizada, foi realizada a montagem e programação do motor 
tendo como suporte peças do LEGO Mindstorms NXT como base de sustentação do 
objeto. Os sensores e motores foram adicionados para o funcionamento da programação, 
conforme a Figura 3. 
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Figura 3: Sensor e motor acoplado ao dispositivo 


Fonte: Autores, 2021 


No cano que está servindo como base, foi adicionado um sensor de movimento, que 
ao ser acionado com no mínimo de 15 cm de movimentação de um objeto, permite que o 
motor seja ligado e a rosca gire, disponibilizando uma quantidade de alimento na bandeja. 

O sensor ultrassônico é acionado quando ocorre a reflexão das ondas sonoras para 
medição da distância entre o sensor e o objeto que estiver em sua direção. Esse sensor é 
conectado ao Bloco EV3 através das portas de entradas e cabos achatados. 

Após a programação do Bloco, o software designará o sensor conforme a porta 
utilizada, conforme a Figura 4. 
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Figura 4: Programação LEGO 


Fonte: Autores, 2021 


O alimentador foi montado durante o período remoto, em meio a pandemia, por isso 
os alunos fizeram as reuniões de forma online para a discussão do projeto. A montagem do 
dispositivo foi realizada na casa dos integrantes. Já a parte de programação e adição do 
sensor e motor, foi feita na escola, na sala de informática com as orientações da professora. 
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Após a programação e encaixe dos componentes, o dispositivo foi testado num dos 
portões de entradas dos alunos no prédio escolar, com o cachorro de um dos funcionários. 

Observou-se o funcionamento do dispositivo numa certa proximidade do cão com o 
sensor, acionando a rosca e liberando uma quantidade de ração, conforme demonstrado 
na Figura 5. 


Figura 5: Cão sendo alimentado pelo dispositivo 


Fonte: Autores, 2021 


RESULTADOS E DISCUSSÃO 


O alimentador automático foi produzido de forma simples, não exigindo uma 
programação complexa para seu funcionamento. O resultado foi alcançado, porém existem 
algumas ressalvas, como a necessidade de acrescentar alguns componentes que controlem 
a quantidade de ração a ser liberada. 

O maior benefício desse dispositivo é que a sua produção pode ser feita com 
materiais recicláveis e de fácil acesso, possibilitando a reprodução pela comunidade em 
diversos pontos de um bairro, por exemplo. 

A ideia principal seria fomentar ações como essa, na criação de dispositivos que 
melhorem as condições dos animais de rua, isso foi possível com o uso da tecnologia nas 
aulas de Robótica. 


CONCLUSÕES 

Este trabalho apresentou uma forma simples de produzir um alimentador automático 
para cães de rua, utilizando materiais recicláveis. Como foi apontado, existem muitos 
animais domésticos em situação de abandono, tendo suas necessidades básicas privadas 
por falta de cuidados, assim se pensou em uma solução baseada no ensino de Robótica. 
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A Robótica Educacional também pode incentivar os alunos a buscarem soluções 
de problemas que envolvam as questões sociais, pois essa tecnologia mostra que seus 
conteúdos podem ser usados de diversas maneiras e com vários níveis de aprendizagem. 
Sendo um curso interdisciplinar, não é necessário seu uso apenas em competições ou 
atividades que requerem aprofundamento em programação. 

Conclui-se que é necessário o incentivo não só em questões técnicas, como 
também metodologias que desenvolvam a criticidade e autonomia dos estudantes, frente 
as necessidades sociais. Por isso, quanto mais direcionamentos em questões como essas, 
maiores serão os resultados que podem ser aplicados na melhoria da sociedade como um 
todo. 
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